界面新聞?dòng)浾?| 佘曉晨 伍洋宇 李如嘉
界面新聞編輯 | 劉方遠(yuǎn)
7月26日,上海WAIC2025(世界人工智能大會(huì))開幕這天上午,高溫將地面的雨水不斷蒸發(fā),一層薄薄霧氣籠罩整個(gè)世博園區(qū),行人絡(luò)繹不絕穿過(guò)。
世博展覽館內(nèi),大模型公司“階躍星辰”和具身智能公司“青心意創(chuàng)”的團(tuán)隊(duì)還在一起做著最后的調(diào)試。?
這兩家同樣來(lái)自上海市徐匯區(qū)的企業(yè),即將在幾小時(shí)后場(chǎng)館正式開放時(shí),合作展出一款能隨歌聲起舞的機(jī)器人——Orca。此時(shí),距離雙方真正開始合作才一個(gè)多月。?
事實(shí)上,開展之后Orca成了今年大會(huì)期間人氣最高的機(jī)器人之一。它通過(guò)實(shí)時(shí)語(yǔ)音識(shí)別和肢體語(yǔ)言配合音樂節(jié)奏,并用AI音樂創(chuàng)作能力現(xiàn)場(chǎng)PK了一名真人說(shuō)唱歌手,場(chǎng)面幾度沸騰。

這項(xiàng)能力來(lái)自雙方合作的具身智能多模態(tài)交互解決方案,它結(jié)合了青心意創(chuàng)的多模態(tài)具身算法與階躍星辰端到端語(yǔ)音大模型,可讓機(jī)器人完成?“語(yǔ)言指令-動(dòng)作軌跡-情緒表達(dá)”的低延遲閉環(huán)響應(yīng)。
這成為具身智能與AI大模型彼此促進(jìn)的一次合作范例。
在科技加速演進(jìn)的浪潮中,一場(chǎng)“具身智能+大模型”的創(chuàng)新風(fēng)暴正在上海蓄力成型。機(jī)器人“大腦+小腦+本體”的融合故事背后,暗藏上海具身智能與大模型產(chǎn)業(yè)協(xié)同演進(jìn)的線程。
7月28日,上海市經(jīng)濟(jì)信息化委印發(fā)《上海市進(jìn)一步擴(kuò)大人工智能應(yīng)用的若干措施》,明確提出要降低智能算力使用成本,發(fā)放6億元算力券,加強(qiáng)算力調(diào)度平臺(tái)建設(shè),體系化支持企業(yè)研發(fā)和應(yīng)用大模型,加快大模型生態(tài)空間集聚。
其中針對(duì)具身智能還提出,“支持本市人工智能企業(yè)的軟硬件產(chǎn)品加快研發(fā)與量產(chǎn),對(duì)具身智能機(jī)器人等產(chǎn)品銷售或租用達(dá)到一定規(guī)模的,按核定合同額的5%給予最高500萬(wàn)元獎(jiǎng)勵(lì)?!?/span>
“本體+大腦”
在今年的WAIC展館中,吸引眾多觀眾圍觀的,無(wú)一例外都是正在表演的機(jī)器人們。今年大會(huì)展出的人形機(jī)器人超過(guò)了150臺(tái)。
人形機(jī)器人所代表的具身智能被視為通往AGI(通用人工智能)的必由之路,其核心就在于它為人工智能系統(tǒng)提供了一個(gè)與真實(shí)世界進(jìn)行多維交互的機(jī)制。?
華興資本投資銀行事業(yè)部業(yè)務(wù)合伙人秦川將具身智能大致分為“本體派”與“大腦派”兩大派別。?
“本體派”以硬件驅(qū)動(dòng),機(jī)器人本體運(yùn)動(dòng)控制技術(shù)為主,其核心競(jìng)爭(zhēng)力是硬件設(shè)計(jì)、工程能力,同一時(shí)期內(nèi)可達(dá)到更低的硬件成本和更高的硬件性能,商業(yè)化上更容易取得進(jìn)展。?
“大腦派”則以AI驅(qū)動(dòng),聚焦背后模型能力以及機(jī)器人本體泛化性。這一路線目前要攻克的難題更多,例如解決數(shù)據(jù)收集問題、算法問題等,但它的能力上限也更高。當(dāng)前,以VLA(Vision-Language-Action)典型架構(gòu)為代表的具身智能基座大模型,在很大程度上呈現(xiàn)了機(jī)器人理解世界的跨任務(wù)泛化潛力。
兩派疊加,就是機(jī)器人“大腦+小腦+本體”的融合之路。這也是具身智能與大模型形成產(chǎn)業(yè)協(xié)同的機(jī)會(huì)。
生數(shù)科技CEO駱怡航對(duì)界面新聞解釋稱,無(wú)論是數(shù)字信息還是物理信息,本質(zhì)上都是時(shí)空信息,并且都采用信息輸入、決策輸出的交互邏輯,因此多模態(tài)模型對(duì)于物理世界規(guī)律的理解與具身智能是通用的。
對(duì)于重視科創(chuàng)產(chǎn)業(yè)并已有相關(guān)資源積累的城市而言,這是一個(gè)托舉初創(chuàng)團(tuán)隊(duì)、鞏固本土科創(chuàng)勢(shì)能的重要契機(jī)。2023年,上海發(fā)布《促進(jìn)智能機(jī)器人產(chǎn)業(yè)行動(dòng)方案》,鼓勵(lì)“大腦+小腦+本體”協(xié)同攻關(guān)。?
2024年10月,智元機(jī)器人與上海浦江實(shí)驗(yàn)室低調(diào)展開了一場(chǎng)合作。雙方在張江機(jī)器人谷組建了一個(gè)4000平米的機(jī)器人訓(xùn)練場(chǎng),場(chǎng)內(nèi)包含三千多種真實(shí)物品,復(fù)刻了家居、餐飲、工業(yè)、商超和辦公等核心場(chǎng)景,并部署100臺(tái)機(jī)器人,開啟了為時(shí)3個(gè)月的大規(guī)模數(shù)據(jù)捕捉與采集。
智元機(jī)器人合伙人、具身業(yè)務(wù)部總裁姚卯青全程參與了這個(gè)項(xiàng)目。他告訴界面新聞?dòng)浾?,彼時(shí),全球從學(xué)術(shù)界到工業(yè)界還沒有一個(gè)合格的工業(yè)級(jí)真實(shí)高質(zhì)量數(shù)據(jù)集供科研人員和企業(yè)參考,這場(chǎng)合作的主要原因之一就是補(bǔ)足這一空缺。
2024年年底,機(jī)器人數(shù)據(jù)集AgiBot World(智元世界)正式開源。在其包含的100種真實(shí)場(chǎng)景中,80%為長(zhǎng)程任務(wù),時(shí)長(zhǎng)集中在60s-150s之間。AgiBot World的長(zhǎng)程數(shù)據(jù)規(guī)模、場(chǎng)景范圍覆蓋面已超越谷歌Open X-Embodiment,成為被業(yè)界引用的主流數(shù)據(jù)集之一。
2025年3月,基于該數(shù)據(jù)集訓(xùn)練的通用具身基座模型——智元啟元大模型(GO-1)發(fā)布,搭載該模型的機(jī)器人在倒水、清理桌面、補(bǔ)充飲料等任務(wù)成功率上相較行業(yè)已有模型均有所提升。
智元是上海最知名的具身智能初創(chuàng)企業(yè),創(chuàng)始團(tuán)隊(duì)包括來(lái)自華為的“天才少年”稚暉君等。智元選擇的發(fā)展路線一定程度上展現(xiàn)了上海對(duì)于具身智能的追求方向,那就是不僅僅是要做出一個(gè)機(jī)器人的軀殼,同時(shí)要賦予它AI的大腦,成為最有“人味”的機(jī)器人。

產(chǎn)業(yè)鏈優(yōu)勢(shì)
在上海,張江作為承載科技創(chuàng)新的重要土壤之一,以往最突出的產(chǎn)業(yè)是生物醫(yī)療和半導(dǎo)體。如今,張江具身智能產(chǎn)業(yè)鏈相關(guān)企業(yè)已集聚70余家,包括10多家整機(jī)企業(yè)及50多家零部件及關(guān)鍵軟件、功能型平臺(tái)企業(yè)等。
傲意科技是一家成立于2015年、總部位于張江高科園區(qū)的公司。作為國(guó)內(nèi)唯一同時(shí)掌握無(wú)創(chuàng)腦機(jī)接口與機(jī)器人靈巧手核心技術(shù)的企業(yè),公司產(chǎn)品已服務(wù)全球近萬(wàn)名終端用戶。
同為張江企業(yè),傲意科技和智元機(jī)器人是“面對(duì)面”的鄰居。在一些產(chǎn)品項(xiàng)目上,傲意科技為智元供應(yīng)靈巧手部件。姚卯青表示,和傲意合作的首要考量是其出貨量較為領(lǐng)先,產(chǎn)品在同類產(chǎn)品里也具有競(jìng)爭(zhēng)力,再加上距離的相近,達(dá)成合作就順理成章。
從上海出發(fā),經(jīng)過(guò)一小時(shí)不到的車程可以到達(dá)杭州、蘇州、常州。這幾個(gè)城市提供的電子元器件、精密機(jī)械加工、模具制造能力支撐起重要的供應(yīng)鏈,在具身智能產(chǎn)品的快速迭代中發(fā)揮重要作用。

秦川向界面新聞總結(jié)稱,從產(chǎn)業(yè)鏈上來(lái)看,長(zhǎng)三角是一個(gè)緊密聯(lián)動(dòng)的城市體,比如蘇州、常州等都具備高端制造能力。?
擎朗智能CEO李通就是考慮到這個(gè)原因把公司總部放在了上海。李通曾在微軟亞洲工程院工作,2010年,他放棄了微軟的高薪創(chuàng)立了上海擎朗智能科技有限公司,專注于室內(nèi)無(wú)人配送機(jī)器人的自主研發(fā)和生產(chǎn)。
李通告訴界面新聞,他當(dāng)初就是看中了長(zhǎng)三角作為機(jī)電供應(yīng)鏈核心的位置,這對(duì)生產(chǎn)機(jī)器人至關(guān)重要。目前擎朗旗下已擁有多款智能機(jī)器人產(chǎn)品遠(yuǎn)銷海內(nèi)外,包括送餐機(jī)器人,酒店機(jī)器人等等。
具身智能產(chǎn)業(yè)涉及多個(gè)軟件和硬件環(huán)節(jié),上下游企業(yè)實(shí)際上都處于“試驗(yàn)”階段。在這樣的狀態(tài)下,工廠和研發(fā)總部距離更近是一個(gè)巨大的優(yōu)勢(shì),一切都會(huì)變得更加高效。?
姚卯青向界面新聞分析稱,很多成熟的產(chǎn)業(yè)可以做到設(shè)計(jì)和生產(chǎn)制造完全解耦,比如蘋果手機(jī)——在加州進(jìn)行設(shè)計(jì)、再在中國(guó)生產(chǎn),這已經(jīng)是司空習(xí)慣的流程。但機(jī)器人產(chǎn)業(yè)當(dāng)下仍處于早期發(fā)展階段,許多產(chǎn)品都未成熟,因而很多時(shí)候,研發(fā)和生產(chǎn)制造要共同完成整個(gè)流程,一起做優(yōu)化、解決問題。?
據(jù)界面新聞了解,為了追求“激進(jìn)”的生產(chǎn)目標(biāo),智元機(jī)器人團(tuán)隊(duì)在產(chǎn)品交付后期時(shí)常需要持續(xù)駐扎在代工廠。從智元機(jī)器人所在的上海張江到蘇州的靈猴公司,只需要一個(gè)半小時(shí)的車程。后者是智元長(zhǎng)期合作的一家核心零部件供應(yīng)商。在交付后期,智元機(jī)器人的團(tuán)隊(duì)基本上全部駐扎在了靈猴。
智元也曾試過(guò)和珠三角地區(qū)的代工廠合作,但過(guò)程中出現(xiàn)了更多問題:無(wú)論是在周期,還是返工層面,遠(yuǎn)距離都給研發(fā)增加了困難。
尤其是對(duì)于機(jī)器人行業(yè)來(lái)說(shuō),“關(guān)節(jié)”至關(guān)重要。智元的關(guān)節(jié)供應(yīng)商一家來(lái)自于蘇州,一家來(lái)自于常州。生產(chǎn)過(guò)程往往需要快速調(diào)試,而這些供應(yīng)商的員工也時(shí)常被智元“搖過(guò)來(lái)”駐場(chǎng)。
今年7月,智元機(jī)器人和宇樹科技中標(biāo)中國(guó)移動(dòng)旗下公司1.2億元人形機(jī)器人采購(gòu)訂單。市場(chǎng)加速時(shí),產(chǎn)業(yè)協(xié)同的重要性愈發(fā)突顯。
早期,具身智能企業(yè)或依賴場(chǎng)景開放和補(bǔ)貼獲得市場(chǎng)份額,但真正決定比賽終局的,仍為核心技術(shù)的突破。因此在這一過(guò)程中,越來(lái)越多的企業(yè)開始從追求單點(diǎn)技術(shù)優(yōu)勢(shì)轉(zhuǎn)向謀求產(chǎn)業(yè)鏈上的協(xié)同。?
浪潮之中,何以立足?
在前沿技術(shù)浪潮的奔涌中,資金和人才缺一不可。對(duì)于具身智能產(chǎn)業(yè)來(lái)說(shuō)亦是如此。
上海擁有包括復(fù)旦大學(xué)和上海交通大學(xué)在內(nèi)的多所知名院校,為各個(gè)機(jī)器人公司輸送了大量具有專業(yè)知識(shí)背景的人才。
復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、博士生導(dǎo)師張奇告訴界面新聞,以研究生實(shí)驗(yàn)室為例,據(jù)他觀察,畢業(yè)后留在上海的學(xué)生超過(guò)90%。他坦言,這是因?yàn)閹缀跛醒鹤I的互聯(lián)網(wǎng)大廠都在上海設(shè)立了辦公室。
值得一提的是,上??苿?chuàng)產(chǎn)業(yè)此前的沉淀,給具身智能產(chǎn)業(yè)也提供了巨大的人才池。
姚卯青表示,在大模型層面,不同城市的人才差距已經(jīng)不大,但在硬件層面,深圳的人才密度的確更高。不過(guò),智元在上海招聘了不少有自動(dòng)駕駛、掃地機(jī)器人和服務(wù)機(jī)器人的員工,這是上海在過(guò)往產(chǎn)業(yè)發(fā)展中積累的優(yōu)勢(shì)。
據(jù)智聯(lián)招聘統(tǒng)計(jì),今年1-5月國(guó)內(nèi)機(jī)器人產(chǎn)業(yè)招聘職位數(shù)同比增長(zhǎng)6%,其中人形機(jī)器人領(lǐng)域招聘需求同比激增409%,技術(shù)崗位占比超6成。?
由于上海周邊的制造業(yè)較為發(fā)達(dá),在蘇州、常州、無(wú)錫,可以招聘到的制造業(yè)人才也不少。姚卯青認(rèn)為,綜合來(lái)看,上海的軟硬件實(shí)力較為領(lǐng)先。上海市經(jīng)信委主任張英曾透露,近四年來(lái),上海的人工智能人才從10萬(wàn)增加到了現(xiàn)在的25萬(wàn)。

擎朗智能目前近千名員工,研發(fā)人員占比接近一半。李通提到,中國(guó)的理工科畢業(yè)生基本上占到全球的一半,對(duì)于理工科的重視,可能是中國(guó)今天能成為“世界工廠”的重要原因。
李通稱,隨著公司業(yè)務(wù)規(guī)模的擴(kuò)大,機(jī)器人公司對(duì)于國(guó)際化人才的需求也逐步加深。擎朗智能的公司總部在上海,但在全球五個(gè)國(guó)家和地區(qū)設(shè)立了子公司及辦公室。“在上海,更容易招聘到國(guó)際化人才,這是其他城市沒有的優(yōu)勢(shì)?!?/span>
人才的聚集并非一蹴而就。上海政府、高校和企業(yè)正在從各個(gè)層面打響人才競(jìng)賽。今年7月,上海交大發(fā)布AI未來(lái)基金,重點(diǎn)關(guān)注全球青年AI人才鏈接。作為上海徐匯推出的全國(guó)首個(gè)大模型創(chuàng)新生態(tài)社區(qū),模速空間近兩年著力的重點(diǎn)之一就是人才服務(wù)。
除了人才,長(zhǎng)期且穩(wěn)定的資金支持也至關(guān)重要。
秦川直言,被投企業(yè)選擇城市落地,核心還是在錢。無(wú)論是硬件在創(chuàng)新、算法訓(xùn)練還是場(chǎng)景驗(yàn)證,具身智能的進(jìn)化都是一場(chǎng)“燒錢戰(zhàn)”。?
從投資機(jī)構(gòu)的視角來(lái)看,除了主流美元基金,政府基金在這一輪具身智能產(chǎn)業(yè)的發(fā)展中顯示出了極高的參與度。?
秦川的觀察是,除了美元基金外,政府基金、產(chǎn)業(yè)基金,尤其是是國(guó)企、央企牽頭的基金機(jī)構(gòu),會(huì)加速全行業(yè)對(duì)于具身智能認(rèn)知的提升。
具身智能對(duì)于場(chǎng)景探索有獨(dú)特的需求,政府及產(chǎn)業(yè)基金能在這一層面提供資金之外的支持,這也更有利于產(chǎn)業(yè)發(fā)展。
秦川舉例稱,上海某頭部汽車主機(jī)廠旗下創(chuàng)投業(yè)務(wù)的各分支基金,目前都已參與了多個(gè)具身智能項(xiàng)目的投資。這將不僅為其帶來(lái)資本層面收益,也有機(jī)會(huì)促進(jìn)被投企業(yè)在投資方的業(yè)務(wù)場(chǎng)景的協(xié)同落地。
據(jù)智東西統(tǒng)計(jì),今年第一季度,國(guó)內(nèi)具身智能相關(guān)的融資事件共37筆,涉及33家企業(yè)。其中上海的企業(yè)達(dá)到大約10家。?
就在剛剛過(guò)去的這個(gè)周末,到WAIC現(xiàn)場(chǎng)前來(lái)“找項(xiàng)目”的投資人同樣絡(luò)繹不絕,他們都渴望在具身智能等新領(lǐng)域找到下一個(gè)“DeepSeek”。