界面新聞?dòng)浾?| 梁寶欣
界面新聞編輯 | 林騰
AI推理芯片正成為人工智能行業(yè)新的涌入方向。
7月25日,2025年世界人工智能大會(huì)期間,界面新聞?dòng)浾吡私獾?,深圳云天?lì)飛(688343.SH)宣布全面聚焦AI推理芯片,圍繞邊緣計(jì)算、云端大模型推理、具身智能三大場(chǎng)景,目標(biāo)是國(guó)產(chǎn)算力“加速器”。
云天勵(lì)飛董事長(zhǎng)兼CEO陳寧告訴界面新聞等媒體,2025年成為人工智能發(fā)展的重要轉(zhuǎn)折點(diǎn)——大模型技術(shù)達(dá)到新的成熟高度,模型調(diào)用成本顯著降低。AI從“專家工具”逐步演變?yōu)椤叭窕A(chǔ)設(shè)施”。AI正從訓(xùn)練時(shí)代邁入推理時(shí)代,預(yù)示著推理算力需求將迎來(lái)爆發(fā)式增長(zhǎng)。
今年以來(lái),以DeepSeek R1為代表的新一代大模型加速發(fā)展,推動(dòng)AI產(chǎn)業(yè)的深度變革。中信建投證券研報(bào)指出,DeepSeek?R1在長(zhǎng)CoT數(shù)據(jù)微調(diào)基礎(chǔ)上應(yīng)用強(qiáng)化學(xué)習(xí),除性能提升外,DeepSeekR1采用GRPO強(qiáng)化學(xué)習(xí)策略,專門(mén)優(yōu)化數(shù)學(xué)推理任務(wù),減少計(jì)算資源消耗,實(shí)現(xiàn)更低的成本。從推理成本來(lái)看,R1模型價(jià)格只有OpenAI?o1模型的幾十分之一,具有極高的性價(jià)比優(yōu)勢(shì)。
除此之外,中信建投證券研報(bào)還提到,三大增量助力推理算力需求加速,一是各家互聯(lián)網(wǎng)大廠加速AI與原有業(yè)務(wù)結(jié)合,二是Agent和深度思考推理的結(jié)合,三是多模態(tài)加速滲透。
陳寧表示,未來(lái)AI可能全面重塑我們身邊的各類電子產(chǎn)品——從智能耳機(jī)、智能眼鏡等可穿戴設(shè)備,到掃地機(jī)器人、冰箱等家用電器,再到電動(dòng)汽車(chē),幾乎所有電子設(shè)備的形態(tài)與功能都將被重新定義。這些設(shè)備將具備“主動(dòng)工作”的能力,能像人類一樣開(kāi)口交流,理解復(fù)雜指令、主動(dòng)回應(yīng)需求甚至解決實(shí)際問(wèn)題??梢灶A(yù)見(jiàn),未來(lái)各類智能設(shè)備,也能通過(guò)更人性化的交互,實(shí)現(xiàn)功能的躍升與體驗(yàn)的革新。而這一切場(chǎng)景的落地,都離不開(kāi)AI 推理芯片的底層支撐。
推理算力需求的爆發(fā),核心依賴AI推理芯片——這是云天勵(lì)飛選擇聚焦該領(lǐng)域的關(guān)鍵背景。
從AI芯片的分類來(lái)看,根據(jù)所承擔(dān)任務(wù)的不同,可分為訓(xùn)練芯片和推理芯片。其中,推理芯片主要負(fù)責(zé)利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行推理預(yù)測(cè),需綜合考量單位能耗算力、時(shí)延、成本等多方面指標(biāo)。
“雖然當(dāng)前AI推理芯片市場(chǎng)仍處于藍(lán)海階段,其市場(chǎng)規(guī)模相較于數(shù)千億美元的訓(xùn)練芯片市場(chǎng)仍較小,但預(yù)計(jì)未來(lái)三至五年內(nèi),AI推理芯片的增長(zhǎng)速度將大幅超越訓(xùn)練芯片。”陳寧說(shuō)。
針對(duì)各類應(yīng)用場(chǎng)景,云天勵(lì)飛已開(kāi)發(fā)出?DeepEdge10C、DeepEdge10標(biāo)準(zhǔn)版、DeepEdge10Max?和?DeepEdge200?四款芯片。
據(jù)了解,2023年11月 ,云天勵(lì)飛正式發(fā)布面向邊緣人工智能的DeepEdge10系列推理芯片,其核心定位便是滿足邊緣端對(duì)千億參數(shù)大模型的部署需求,支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各類不同架構(gòu)的主流模型。
從技術(shù)底層來(lái)看,DeepEdge10系列芯片采用的是“算力積木”架構(gòu),通過(guò)D2D?Chiplet技術(shù)、C2C?Mesh技術(shù)和C2C?Mesh?Torus技術(shù),將多個(gè)標(biāo)準(zhǔn)計(jì)算單元像搭積木一樣,封裝成不同算力的芯片和多芯片互連的可擴(kuò)展計(jì)算系統(tǒng),覆蓋8T-256T算力需求,可實(shí)現(xiàn)7B、14B、130B、671B等不同參數(shù)量大模型的推理,賦能各類智算推理硬件產(chǎn)品。
云天勵(lì)飛CTO李愛(ài)軍表示,算力積木架構(gòu)實(shí)現(xiàn)了兩方面核心能力:一方面是算力的縱向拓展(scaleup),即在單個(gè)計(jì)算節(jié)點(diǎn)內(nèi)聚合更多算力——通過(guò)該架構(gòu),可在一個(gè)封裝內(nèi)最多集成8個(gè)算力積木,形成統(tǒng)一算力。這一架構(gòu)源于2020年對(duì)GPT等算法的分析,目前已在Edge10芯片上落地,實(shí)現(xiàn)了單個(gè)封裝內(nèi)集成8個(gè)積木、達(dá)成128T推理算力的單芯片成果。
另一方面是通過(guò)C2C?Mesh技術(shù)(結(jié)合Mesh互聯(lián)與Mesh?Torus技術(shù))實(shí)現(xiàn)算力擴(kuò)展:將多個(gè)節(jié)點(diǎn)首尾連接形成更大規(guī)模的算力池,從而支撐MoE架構(gòu)大模型的推理。
目前,DeepEdge10芯片平臺(tái)已成功適配DeepSeekR1系列模型、QwQ-32B模型及國(guó)產(chǎn)鴻蒙操作系統(tǒng)。
從經(jīng)營(yíng)數(shù)據(jù)來(lái)看,2024年云天勵(lì)飛營(yíng)收增長(zhǎng)了81%;今年一季度,這一增速進(jìn)一步提升至160%。云天勵(lì)飛管理層表示,展望下半年,隨著AI推理算法的迭代、算力需求的攀升以及AI應(yīng)用的持續(xù)拓展,有信心繼續(xù)保持高速增長(zhǎng)的態(tài)勢(shì)。