DeepSeek效應(yīng)席卷 AI芯片廠商的機(jī)會(huì)和分化
來(lái)源:21世紀(jì)經(jīng)濟(jì)報(bào)道作者:駱軼琪2025-02-14 08:06

在DeepSeek極低成本的推動(dòng)下,開(kāi)源模型和閉源模型的差距顯著縮小,也掀起一輪國(guó)產(chǎn)AI芯片廠商競(jìng)相適配風(fēng)潮。

21世紀(jì)經(jīng)濟(jì)報(bào)道記者綜合觀察發(fā)現(xiàn),大約自2月1日開(kāi)始,國(guó)產(chǎn)頭部AI芯片廠商先后宣布實(shí)現(xiàn)與DeepSeek旗下不同模型陸續(xù)展開(kāi)適配工作。據(jù)不完全統(tǒng)計(jì),目前有不少于20家國(guó)內(nèi)廠商參與其中。

AI芯片市場(chǎng)主要包含CPU、GPU、ASIC、FPGA等不同類型芯片,在AI對(duì)大規(guī)模并行計(jì)算的需求下,GPU芯片需求快速攀升,由此帶來(lái)英偉達(dá)業(yè)績(jī)和股價(jià)的雙重飆升。但DeepSeek的出現(xiàn),象征著AI推理側(cè)成本正在快速下探,由此將拉動(dòng)更為廣闊的應(yīng)用市場(chǎng)涌現(xiàn)。

這意味著,不僅限于GPU芯片,在AI推理側(cè)有細(xì)分優(yōu)勢(shì)的ASIC、FPGA等芯片也將有豐富的發(fā)展機(jī)會(huì)。此外,國(guó)產(chǎn)AI芯片廠商恰恰在AI推理領(lǐng)域有更多能力沉淀,因此多名業(yè)內(nèi)人士對(duì)記者表示,這有望推動(dòng)國(guó)內(nèi)廠商有機(jī)會(huì)在推理側(cè)與英偉達(dá)搶占一定份額。

但是,此前DeepSeek多采用英偉達(dá)GPU系列芯片,更多適配CUDA生態(tài),國(guó)產(chǎn)芯片如何在此條件下撬動(dòng)更多份額,這又是否會(huì)為英偉達(dá)的市場(chǎng)帶來(lái)擠壓?都是業(yè)內(nèi)的關(guān)注焦點(diǎn)。

圖片來(lái)源:創(chuàng)意制圖 梁遠(yuǎn)浩

國(guó)產(chǎn)芯片齊聚

伴隨DeepSeek席卷全球而來(lái)的,是國(guó)內(nèi)芯片廠商的涌動(dòng)。2月以來(lái),多家國(guó)內(nèi)AI芯片廠商密集宣布,與DeepSeek不同規(guī)格模型陸續(xù)完成適配。

例如,2月2日,Gitee AI稱上線1.5B、7B、14B、32B四個(gè)尺寸的DeepSeek R1模型,并均部署在國(guó)產(chǎn)沐曦曦云GPU上。2月5日,Gitee AI又宣布,經(jīng)測(cè)試已確認(rèn)DeepSeek-V3全精度滿血版(671B)可以成功運(yùn)行在沐曦訓(xùn)推一體GPU上,并將V3滿血版上線到平臺(tái)上。

2月4日,天數(shù)智芯稱在與Gitee AI協(xié)作下,用時(shí)一天完成與DeepSeek R1的適配工作,上線1.5B、7B、14B規(guī)格大模型服務(wù)。2月9日,天數(shù)智芯稱,DeepSeek R1-Distill-Qwen(1.5B/7B/14B/32B)、DeepSeek R1-Distill-Llama(8B/70B)等多款不同參數(shù)模型服務(wù)已經(jīng)在各大平臺(tái)上線。

2月6日,燧原科技完成對(duì)DeepSeek全量模型適配,包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸餾模型。

綜合觀察這些廠商的表述不難發(fā)現(xiàn),“適配速度”是尤其被重視的指標(biāo)。率先被適配的是模型參數(shù)量偏小的蒸餾模型,MoE基礎(chǔ)模型的適配時(shí)間顯然會(huì)更長(zhǎng)。

這背后其實(shí)透露出,國(guó)內(nèi)AI芯片廠商在試圖證實(shí),自身在AI生態(tài)適配方面的速度和實(shí)力。

對(duì)比來(lái)看,英偉達(dá)GPU芯片目前被全球廣泛使用,大有壟斷態(tài)勢(shì),背后源自其構(gòu)建了三大護(hù)城河:硬件GPU芯片+軟件CUDA生態(tài)+NV Link連接。國(guó)產(chǎn)芯片要在GPU領(lǐng)域加速發(fā)展?jié)B透,生態(tài)建設(shè)就是重要一環(huán),生態(tài)的完善程度,一定程度決定了AI芯片的能力是否可以被充分釋放以及應(yīng)用落地速度。

但CUDA生態(tài)已發(fā)展十多年,在這一層面要很快完成追趕顯然不容易,目前國(guó)產(chǎn)芯片廠商中,有的選擇自主架構(gòu)、先從垂直應(yīng)用領(lǐng)域著手構(gòu)建生態(tài),有的則兼容CUDA生態(tài)來(lái)推動(dòng)發(fā)展。

海光信息就指出,因其DCU芯片采用了GPGPU通用加速計(jì)算架構(gòu),DeepSeek模型可直接在DCU上運(yùn)行,并不需要大量適配工作,技術(shù)團(tuán)隊(duì)的主要工作是進(jìn)行精度驗(yàn)證和持續(xù)的性能優(yōu)化。

“眾多國(guó)產(chǎn)AI芯片廠商與DeepSeek的快速適配潮是中國(guó)芯片實(shí)現(xiàn)國(guó)際化突擊的第一步?!盋IC灼識(shí)咨詢高級(jí)咨詢顧問(wèn)張笑璐對(duì)記者分析道,DeepSeek對(duì)于中國(guó)AI芯片廠商的利好非常確定,通過(guò)與DeepSeek合作,中國(guó)芯片廠商加速了深度學(xué)習(xí)框架和分布式訓(xùn)練適配,推動(dòng)了中國(guó)“國(guó)產(chǎn)算力+國(guó)產(chǎn)大模型”閉環(huán)生態(tài)。

她進(jìn)一步指出,過(guò)去中國(guó)AI芯片的核心挑戰(zhàn)是英偉達(dá)GPU和其CUDA生態(tài)在全球AI訓(xùn)練芯片領(lǐng)域的統(tǒng)治地位。而DeepSeek的出現(xiàn),通過(guò)模型蒸餾技術(shù)和高效的算法優(yōu)化,降低模型對(duì)于硬件算力要求。同時(shí)DeepSeek通過(guò)專家混合系統(tǒng)(MoE)、多頭潛在注意力機(jī)制(MLA)和RMSNorm核心組件,并采用專家共享機(jī)制、動(dòng)態(tài)路由算法和潛在變量緩存技術(shù),在模型保持高性能水平的同時(shí)降低計(jì)算開(kāi)銷,以實(shí)現(xiàn)在有限計(jì)算資源的情況下的高效運(yùn)行。

“性能表現(xiàn)角度來(lái)看DeepSeek推理任務(wù)表現(xiàn)與OpenAI媲美,甚至在部分任務(wù)有所領(lǐng)先。這使得國(guó)產(chǎn)AI芯片在推理端可以快速實(shí)現(xiàn)商業(yè)化,同時(shí)說(shuō)明了用國(guó)產(chǎn)AI芯片替換英偉達(dá)GPU是非??尚械摹!睆埿﹁纯偨Y(jié)道。

當(dāng)然她也指出,訓(xùn)練端國(guó)產(chǎn)芯片與英偉達(dá)的差異依然存在,在更復(fù)雜的模型訓(xùn)練場(chǎng)景下,國(guó)產(chǎn)芯片還需提升。此外也有挑戰(zhàn),中國(guó)AI芯片生態(tài)碎片化問(wèn)題還需要進(jìn)一步統(tǒng)一,來(lái)提升整體開(kāi)發(fā)效率,降低開(kāi)發(fā)成本。

AI推理風(fēng)起

在DeepSeek帶動(dòng)下,近日來(lái),包括OpenAI、豆包、百度等巨頭也證實(shí)了推理側(cè)成本正在快速下降的現(xiàn)實(shí)。

張笑璐對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者分析,DeepSeek訓(xùn)練成本的大幅下降打破了行業(yè)更高訓(xùn)練成本與更好的模型/產(chǎn)品性能表現(xiàn)的局限,因此行業(yè)關(guān)注點(diǎn)更多從過(guò)去決定下限的訓(xùn)練環(huán)節(jié),轉(zhuǎn)向現(xiàn)在能夠確定上限的推理環(huán)節(jié)。對(duì)于下游行業(yè)來(lái)說(shuō),中算力的玩家也能夠在DeepSeek的助力下實(shí)現(xiàn)性能提升。

通常來(lái)說(shuō),被廣泛采用的英偉達(dá)GPU芯片早期多被用于AI大模型訓(xùn)練,但到了推理階段,考慮到不同廠商的訴求差異,更多應(yīng)用類廠商都開(kāi)始著力開(kāi)發(fā)自己的AI推理芯片,多為定制化ASIC芯片。

海外云服務(wù)廠商谷歌、Meta、亞馬遜等在近期發(fā)布財(cái)報(bào)過(guò)程中都或多或少提到了自研推理芯片的業(yè)務(wù)進(jìn)展。例如谷歌借助自研TPU芯片Trillium系列,加速搜索引擎能力優(yōu)化;Meta借助自研芯片MTIA系列強(qiáng)化社群算法和廣告分發(fā)能力等。

對(duì)此,TrendForce集邦咨詢分析師龔明德對(duì)記者分析,“預(yù)期在DeepSeek驅(qū)動(dòng)下,將促使CSP(云服務(wù)商)業(yè)者更積極投入較低成本的自有ASIC方案,并從AI Training(訓(xùn)練)重心轉(zhuǎn)往AI Inference(推理)。展望2028年,其占比預(yù)期將逐漸提升至五成?!?/p>

在此發(fā)展態(tài)勢(shì)下,他認(rèn)為,這將有望帶動(dòng)國(guó)內(nèi)各行業(yè)(如車用、電商、互聯(lián)網(wǎng)及各種基建等)的AI推理芯片開(kāi)發(fā)或相關(guān)業(yè)者發(fā)展商機(jī)。然而,仍面臨主要挑戰(zhàn)在于,無(wú)論AI芯片硬件或軟件方面,均需投入相當(dāng)?shù)某杀净驎r(shí)間累積。

不過(guò)這由此引發(fā)ASIC芯片是否會(huì)搶占AI芯片整體市場(chǎng)中GPU芯片的地位。根據(jù)21世紀(jì)經(jīng)濟(jì)報(bào)道記者綜合了解,業(yè)內(nèi)普遍認(rèn)為并非如此,應(yīng)該說(shuō),ASIC芯片和GPU芯片是在共同“做大蛋糕”,而非“分食”。

TrendForce集邦咨詢分析師邱珮雯對(duì)21世紀(jì)經(jīng)濟(jì)報(bào)道記者指出,從AI芯片來(lái)看,未來(lái)市場(chǎng)GPU與ASIC會(huì)同時(shí)并存。云端業(yè)者除了采用英偉達(dá)GPU以外,也在積極研發(fā)自身ASIC芯片,除了針對(duì)自身應(yīng)用定制化以外,還能降低對(duì)英偉達(dá)芯片的依賴度,同時(shí)降低支出成本。

“ASIC芯片的成本優(yōu)勢(shì)可能會(huì)逐步顯現(xiàn)?!睆埿﹁匆舱J(rèn)為,盡管ASIC在某些特定推理場(chǎng)景中會(huì)持續(xù)蠶食GPU的市場(chǎng)份額,但不會(huì)導(dǎo)致GPU需求的總體下降?!霸谛枰笠?guī)模部署和嚴(yán)格功耗控制的應(yīng)用場(chǎng)景中,GPU依然會(huì)在更多通用計(jì)算任務(wù)中保持強(qiáng)勁需求,尤其是在多任務(wù)和多場(chǎng)景的計(jì)算需求下。兩者的市場(chǎng)需求可能不會(huì)簡(jiǎn)單地‘互相替代’,而是將互為補(bǔ)充?!?/p>

另?yè)?jù)21世紀(jì)經(jīng)濟(jì)報(bào)道記者了解,目前在大模型能力適配方面,國(guó)內(nèi)AI芯片廠商更強(qiáng)于AI推理側(cè),但是在有更大規(guī)模集群計(jì)算需求的AI訓(xùn)練側(cè)則還有差距。這也是DeepSeek多款模型更適配這些廠商能力的原因。

考慮到DeepSeek此前多適配英偉達(dá)旗下芯片,國(guó)內(nèi)廠商要承接其生態(tài)是否面臨門檻?

張笑璐告訴21世紀(jì)經(jīng)濟(jì)報(bào)道記者,從模型架構(gòu)通用性看,DeepSeek模型基于Transformer架構(gòu),是諸多領(lǐng)域模型的基礎(chǔ),因此適配并非難題。在軟件生態(tài)部分,部分國(guó)產(chǎn)芯片兼容CUDA,可復(fù)用TensorFlow/PyTorch生態(tài)資源、加快適配,也有實(shí)力廠商也能自研軟件棧優(yōu)化性能。

“目前國(guó)內(nèi)廠商多進(jìn)行了推理的適配,推理計(jì)算需求較低,可通過(guò)優(yōu)化內(nèi)存和指令集適配。而訓(xùn)練適配的要求更高,涉及分布式計(jì)算和梯度同步,國(guó)產(chǎn)芯片大多仍依賴英偉達(dá)GPU,訓(xùn)練適配是難點(diǎn)?!彼m(xù)稱。

責(zé)任編輯: 鄧衛(wèi)平
聲明:證券時(shí)報(bào)力求信息真實(shí)、準(zhǔn)確,文章提及內(nèi)容僅供參考,不構(gòu)成實(shí)質(zhì)性投資建議,據(jù)此操作風(fēng)險(xiǎn)自擔(dān)
下載“證券時(shí)報(bào)”官方APP,或關(guān)注官方微信公眾號(hào),即可隨時(shí)了解股市動(dòng)態(tài),洞察政策信息,把握財(cái)富機(jī)會(huì)。
網(wǎng)友評(píng)論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評(píng)論僅供其表達(dá)個(gè)人看法,并不表明證券時(shí)報(bào)立場(chǎng)
暫無(wú)評(píng)論
為你推薦
時(shí)報(bào)熱榜
換一換
    熱點(diǎn)視頻
    換一換