За BMS, автобус, индустриски, инструментација кабел.

Како што се приближува пролетниот фестивал, возбудата околу Deepseek останува силна. Неодамнешниот празник истакна значително чувство за конкуренција во рамките на технолошката индустрија, при што многумина разговараа и анализираа оваа „сом“. Силиконската долина доживува невидено чувство за криза: застапниците на отворен извор повторно ги изразуваат своите мислења, па дури и Опении преиспитува дали нејзината стратегија со затворен извор е најдобриот избор. Новата парадигма на пониски пресметковни трошоци предизвика реакција на ланец меѓу чипови гиганти како NVIDIA, што доведува до рекордни загуби на еднадневна пазарна вредност во историјата на берзата во САД, додека владините агенции ја испитуваат усогласеноста на чиповите што ги користи Deepseek. Среде мешани прегледи на Deepseek во странство, домашно, доживува извонреден раст. По лансирањето на моделот R1, придружната апликација бележи пораст на сообраќајот, што укажува дека растот на секторите на апликации ќе го придвижи целокупниот екосистем на АИ напред. Позитивниот аспект е дека Deepseek ќе ги прошири можностите за апликација, што укажува дека потпирањето на CHATGPT нема да биде толку скапо во иднина. Оваа промена се рефлектира во неодамнешните активности на Опении, вклучително и обезбедување на модел на расудување наречен О3-Мини на слободни корисници како одговор на Deepseek R1, како и последователни надградби што го направија мисловниот ланец на О3-Мини јавноста. Многу корисници во странство изразија благодарност до Deepseek за овие случувања, иако овој ланец на мислата служи како резиме.
Оптимистички, очигледно е дека Deepseek ги обединува домашните играчи. Со својот фокус на намалување на трошоците за обука, разни производители на нагорни чипови, средни даватели на облак и бројни стартапи активно се приклучуваат на екосистемот, подобрувајќи ја ефикасноста на трошоците за користење на моделот DeepSeek. Според трудовите на Deepseek, целосната обука на моделот V3 бара само 2,788 милиони H800 GPU часа, а процесот на обука е многу стабилен. Архитектурата MOE (мешавина од експерти) е клучна за намалување на трошоците за пред-обука за фактор од десет во споредба со Лама 3 со 405 милијарди параметри. Во моментов, V3 е првиот јавно признат модел што покажува таква висока реткост во МО. Покрај тоа, MLA (мулти слој внимание) работи синергистички, особено во аспекти на расудување. „Спарсер, толку е поголема големината на серијата потребна за време на расудувањето за целосно искористување на компјутерската моќ, со големината на KVCAChe да биде клучен фактор за ограничување; МПП значително ја намалува големината на KVCache“, истакна истражувач од технологијата Чуанџинг во анализата за анализа на технологијата АИ. Севкупно, успехот на Deepseek лежи во комбинацијата на разни технологии, не само една. Инсајдерите во индустријата ги фалат инженерските способности на тимот Deepseek, забележувајќи ја нивната извонредност во паралелна обука и оптимизација на операторот, постигнувајќи важни резултати со рафинирање на сите детали. Пристапот со отворен извор на Deepseek дополнително го разгорува целокупниот развој на големите модели и се очекува дека доколку слични модели се прошират во слики, видеа и повеќе, ова значително ќе ја стимулира побарувачката низ целата индустрија.
Можности за услуги за расудување на трети страни
Податоците укажуваат дека од објавувањето, Deepseek собра 22,15 милиони дневни активни корисници (DAU) во рок од само 21 ден, постигнувајќи 41,6% од корисничката база на CHATGPT и надминува 16,95 милиони дневни активни корисници на Дубао, со што станаа најбрзорастечката апликација на глобално ниво, на врвот на Apple App Store во 157 земји/региони. Како и да е, додека корисниците се собраа во возење, сајбер хакерите немилосрдно ја напаѓаат апликацијата Deepseek, предизвикувајќи значителен напор на неговите сервери. Аналитичарите во индустријата веруваат дека ова е делумно како резултат на картички за распоредување на DeepSeek за обука, додека немаат доволна компјутерска моќ за расудување. Информации за инсајдер во индустријата го информираше прегледот на технологијата за АИ, „Честите проблеми со серверот можат лесно да се решат со наплата на такси или финансирање за купување повеќе машини; на крајот на краиштата, зависи од одлуките на Deepseek“. Ова претставува размена во фокусирање на технологија наспроти продукција. DeepSeek во голема мерка се потпираше на квантната квантизација за самостојно одржување, откако доби малку надворешно финансирање, што резултира во релативно низок притисок на проток на пари и чиста технолошка околина. Во моментов, во светлината на споменатите проблеми, некои корисници бараат Deepseek на социјалните медиуми да ги воздигнат праговите за употреба или да воведат платени карактеристики за подобрување на удобноста на корисниците. Покрај тоа, програмерите започнаа да ги користат официјалните API или трети лица API за оптимизација. Како и да е, отворената платформа на Deepseek неодамна објави: „Тековните ресурси на серверот се оскудни, а надополнувањата на услугата API се суспендирани“.
Ова несомнено отвора повеќе можности за продавачите на трети страни во инфраструктурниот сектор на АИ. Неодамна, бројни домашни и меѓународни облачни гиганти ги лансираа API -те на моделот на Deepseek - гигантите на Microsoft и Amazon беа меѓу првите што се придружија на крајот на јануари. Домашниот лидер, Huawei Cloud, го направи првиот потег, ослободувајќи ги услугите за расудување Deepseek R1 и V3 во соработка со силикон-базиран проток на 1 февруари. Извештаите од AI Technology Review укажуваат дека услугите на Silicon-Based Flow забележале прилив на корисници, ефикасно „паѓаат“ на платформата. Големите три технолошки компании-BAT (Baidu, Alibaba, Tencent) и Bytedance-исто така издадоа ниски цени, ограничено време понуди од 3 февруари, потсетувајќи на минатогодишните војни за цени на Cloud Cloud, запалени од лансирањето на моделот V2 на Deepseek, каде што DeepSeek започна да се нарекува „цена месар“. Безобразните дејства на продавачите на облак одекнуваат на претходните силни врски помеѓу Мајкрософт Азур и Опени, каде во 2019 година, Мајкрософт направи значителна инвестиција од една милијарда американски долари во Openai и ги искористи придобивките од „Chatgpt“ по лансирањето на Chatgpt во 2023 година. Во овој случај, Deepseek не само што го надмина CHATGPT во однос на топлината на производот, туку воведе и модели со отворен извор по објавувањето на О1, слично на возбудата околу заживувањето на Лама на GPT-3.
Во реалноста, давателите на облаци исто така се позиционираат како сообраќајни порти за апликации за ВИ, што значи дека продлабочувањето на врските со развивачите се преведува на превентивни предности. Извештаите посочуваат дека Baidu Smart Cloud имал над 15,000 клиенти користејќи го моделот Deepseek преку платформата Qianfan на денот на лансирањето на моделот. Покрај тоа, неколку помали фирми нудат решенија, вклучувајќи силиконски проток, Лучен технологија, технологија Чуанџинг и разни провајдери на АИ инфра кои започнаа поддршка за моделите Deepseek. Прегледот на технологијата на АИ дозна дека тековните можности за оптимизација за локализирани распоредувања на DeepSeek првенствено постојат во две области: една е оптимизирање за карактеристиките на реткост на моделот MOE со помош на мешан пристап за расудување за распоредување на моделот на MOE од 671 милијарди MOE локално додека се користи хибриден GPU/CPU заклучок. Покрај тоа, оптимизацијата на МПА е од витално значење. Сепак, двата модела на Deepseek сè уште се соочуваат со некои предизвици во оптимизацијата на распоредувањето. „Поради големината на моделот и бројните параметри, оптимизацијата е навистина сложена, особено за локалните распоредувања каде постигнувањето оптимален биланс помеѓу перформансите и трошоците ќе биде предизвик“, изјави истражувач од технологијата Чуанџинг. Најзначајната пречка лежи во надминување на ограничувањата на капацитетот на меморијата. „Ние усвојуваме хетероген пристап за соработка за целосно искористување на процесорот и други компјутерски ресурси, ставајќи ги само не-споделените делови на редок матрицата на МО на процесорот/ДРАМ за обработка со употреба на оператори на процесорот со високи перформанси, додека густите делови остануваат на графичкиот процесор“, објасни тој. Извештаите посочуваат дека рамката со отворен извор на Chuanjing, Ktransformers, првенствено вбризгува разни стратегии и оператори во оригиналната имплементација на трансформатори преку урнек, значително подобрување на брзината на заклучок со употреба на методи како Cudagraph. Deepseek создаде можности за овие стартапи, бидејќи придобивките за раст стануваат очигледни; Многу фирми пријавиле забележителен раст на клиентите по лансирањето на API Deepseek, примајќи прашања од претходните клиенти кои бараат оптимизации. Инсајдерите во индустријата забележале: „Во минатото, нешто воспоставени групи на клиенти честопати беа заклучени во стандардизираните услуги на поголемите компании, цврсто обврзани со нивните предности на трошоците, како резултат на обемот. Сепак, по завршувањето на распоредувањето на DeepSeek-R1/V3 пред пролетниот фестивал, ние одеднаш добивме барања за соработка од неколку добро познати клиенти, и дури и претходно нападни клиенти иницирани контакти за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за воведување на нашите услуги за длабоки страни. Во моментов, се чини дека Deepseek ги прави перформансите на инфекција на модели се повеќе критични, а со пошироко усвојување на големи модели, ова ќе продолжи значително да влијае на развојот во индустријата за АИ Инфра. Ако моделот на ниво на Deepseek може да се распореди локално по ниска цена, тоа во голема мерка ќе им помогне на напорите на владата и на претпријатието за дигитална трансформација. Како и да е, предизвиците опстојуваат, бидејќи некои клиенти можат да имаат големи очекувања во однос на големите модели, што го прави поочигледно дека балансирањето на перформансите и трошоците станува се од витално значење при практичното распоредување.
За да се процени дали Deepseek е подобар од Chatgpt, неопходно е да се разберат нивните клучни разлики, јаки и случаи на употреба. Еве една сеопфатна споредба:
Карактеристика/аспект | Deepseek | Chatgpt |
---|---|---|
Сопственост | Развиен од кинеска компанија | Развиен од Опени |
Модел на извор | Отворен извор | Сопственик |
Цена | Слободно за употреба; Поевтини опции за пристап до API | Претплата или цени за плаќање по употреба |
Прилагодување | Високо прилагодливо, дозволувајќи им на корисниците да ја изменат и да градат врз него | Ограничена достапна прилагодување |
Перформанси во специфични задачи | Ексели во одредени области како аналитика на податоци и пребарување на информации | Разноврсна со силни перформанси во креативно пишување и разговорни задачи |
Јазична поддршка | Силен фокус на кинескиот јазик и културата | Широка јазична поддршка, но центрично во САД |
Трошоци за обука | Пониски трошоци за обука, оптимизирани за ефикасност | Повисоки трошоци за обука, кои бараат значителни пресметковни ресурси |
Варијација на одговор | Може да понуди различни одговори, можеби под влијание на геополитичкиот контекст | Конзистентни одговори засновани на податоци за обука |
Целна публика | Насочени кон развивачите и истражувачите кои сакаат флексибилност | Насочени кон општите корисници кои бараат разговорни способности |
Користете случаи | Поефикасно за генерирање код и брзи задачи | Идеално за генерирање текст, одговарање на прашања и вклучување во дијалог |
Критична перспектива за „нарушување на Nvidia“
Во моментов, настрана од Huawei, неколку домашни производители на чипови како Moore Threads, Muxi, Biran Technology и Tianxu Zhixin исто така се прилагодуваат на двата модела на Deepseek. Производителот на чипови изјави за Преглед на технологија за АИ, „Структурата на Deepseek покажува иновации, но сепак останува LLM. Нашата адаптација кон DeepSeek е првенствено фокусирана на апликации за расудување, правејќи ја техничката имплементација прилично јасна и брза“. Како и да е, пристапот на МВР бара поголеми побарувања во однос на складирање и дистрибуција, заедно со обезбедување компатибилност при распоредување со домашни чипови, презентирање на бројни инженерски предизвици на кои им е потребна резолуција за време на адаптацијата. „Во моментов, домашната компјутерска моќ не одговара на NVIDIA во употребливоста и стабилноста, што бара оригинално учество на фабриката за поставување на софтверско опкружување, смена на проблеми и оптимизација на основните перформанси“, рече лекарот во индустријата врз основа на практично искуство. Истовремено, "Поради големата параметарска скала на DeepSeek R1, домашната компјутерска моќ бара повеќе јазли за паралелизација. Покрај тоа, домашните спецификации на хардверот сè уште се нешто зад себе; на пример, Huawei 910B во моментов не може да го поддржи FP8 inferress воведен од Deepseek." Една од најважните страни на моделот Deepseek V3 е воведување на рамката за обука на мешана прецизност FP8, која е валидирана ефикасно на исклучително голем модел, означувајќи значително достигнување. Претходно, главните играчи како „Мајкрософт“ и „Нвидија“ предложија поврзана работа, но се сомневаат во индустријата во врска со изводливоста. Разбирливо е дека во споредба со INT8, примарната предност на FP8 е дека квантификацијата по обуката може да постигне скоро без загуба прецизност, додека значително ја подобрува брзината на заклучок. Кога се споредува со FP16, FP8 може да реализира до два пати забрзување на H20 и над 1,5 пати за забрзување на H100. Имено, како дискусии околу трендот на домашна компјутерска моќ плус домашните модели добиваат интензитет, шпекулациите за тоа дали NVIDIA би можела да биде нарушена и дали може да се заобиколи Cuda Moat, станува се повеќе распространета. Еден непобитен факт е дека Deepseek навистина предизвика значителен пад на пазарната вредност на NVIDIA, но оваа промена покренува прашања во врска со високиот пресметковен интегритет на NVIDIA. Претходно прифатените наративи во врска со пресметковната акумулација управувана од капитал се оспорени, но сепак останува тешко за NVIDIA да биде целосно заменет во сценарија за обука. Анализата на длабоката употреба на Deepseek на CUDA покажува дека флексибилноста - како што се користи SM за комуникација или директно манипулирање со мрежните картички - не е изводлива за редовни графички процесор за сместување. Ставовите во индустријата потенцираат дека Moat на Nvidia го опфаќа целиот екосистем CUDA, наместо само самата CUDA, и упатствата PTX (паралелно извршување на навој) што ги користи Deepseek сè уште се дел од екосистемот CUDA. „На краток рок, пресметковната моќ на NVIDIA не може да се заобиколи - ова е особено јасно во обуката; сепак, распоредувањето на домашни картички за расудување ќе биде релативно полесно, така што напредокот веројатно ќе биде побрз. Адаптацијата на домашните картички првенствено се фокусира на инфекцијата; никој сè уште не успеа да обучи модел на перформанси на Deepseek на домашните картички на скала“, „Индустрискиот аналитичар“, забележан на AI Technology. Севкупно, од гледна точка на заклучок, околностите се охрабрувачки за домашни чипови со голем модел. Можностите за домашните производители на чипови во рамките на заклучокот се поочигледни заради претерано високите барања на обуката, што го попречуваат влезот. Аналитичарите тврдат дека едноставно искористување на домашните картички за заклучоци е доволна; Доколку е потребно, стекнувањето дополнителна машина е изводливо, додека моделите за обука претставуваат уникатни предизвици - со зголемениот број машини може да стане тешки, а повисоките стапки на грешка можат негативно да влијаат на резултатите од обуката. Обуката исто така има специфични барања за кластери, додека барањата за кластери за заклучок не се толку строги, со што се олеснуваат барањата на графичкиот процесор. Во моментов, перформансите на единечната картичка H20 на Nvidia не ја надминуваат онаа на Huawei или Cambrian; Неговата сила лежи во кластерирање. Based on the overall impact on the computational power market, the founder of Luchen Technology, You Yang, noted in an interview with AI Technology Review, "DeepSeek may temporarily undermine the establishment and rental of ultra-large training computational clusters. In the long run, by significantly reducing the costs associated with large model training, reasoning, and applications, market demand is likely to surge. Subsequent iterations of AI based on this will therefore continually drive одржлива побарувачка на компјутерскиот пазар на енергија “. Покрај тоа, „зголемената побарувачка на Deepseek за расудување и прилагодување на услугите е покомпатибилна со домашниот компјутерски пејзаж, каде локалните капацитети се релативно слаби, помагајќи да се ублажи отпадот од ресурсите во мирување по пост-кластерот; Luchen Technology соработуваше со Huawei Cloud за лансирање на API -а за расудување на сериите Deepseek R1 и услуги за сликање на облак, врз основа на домашна компјутерска моќ. Вие Јанг изрази оптимизам за иднината: „Deepseek ја вметнува довербата во домашно изработените решенија, поттикнувајќи поголем ентузијазам и инвестиции во домашните компјутерски способности што одат напред“.

Заклучок
Дали DeepSeek е „подобар“ од Chatgpt зависи од специфичните потреби и цели на корисникот. За задачите на кои им е потребна флексибилност, ниска цена и прилагодување, Deepseek може да биде супериорен. За креативно пишување, општо испитување и интерфејси за разговор за корисниците, CHATGPT може да го преземе водството. Секоја алатка служи различни цели, така што изборот во голема мерка ќе зависи од контекстот во кој се користат.
Контролни кабли
Структуриран систем за каблирање
Мрежа и податоци, кабел со оптички влакна, печ-кабел, модули, плоча за лице
16-ти април-18-ти, 2024 година, Средно-источно-енергија во Дубаи
16-ти април-18-ти, 2024 година Секурика во Москва
Мај.9.09.09.
Октомври.
Ноември.19-20, 2024 година поврзан светски КСА
Време на објавување: февруари-10-2025 година