具身智能是人工智能通過物理本體與環(huán)境實(shí)時(shí)交互,實(shí)現(xiàn)感知、認(rèn)知、決策和行動(dòng)一體化的智能系統(tǒng),涵蓋人形機(jī)器人、仿生機(jī)器人、環(huán)境嵌入式系統(tǒng)等多種形態(tài)。當(dāng)前,具身智能在與環(huán)境的反復(fù)交互中不斷發(fā)展,認(rèn)知決策能力和本體實(shí)用性能顯著提升,正加速向更自主、跨場(chǎng)景的通用智能演進(jìn)。準(zhǔn)確把握具身智能全球技術(shù)創(chuàng)新態(tài)勢(shì),積極應(yīng)對(duì)深層挑戰(zhàn),對(duì)于在新一輪產(chǎn)業(yè)變革中搶占先機(jī)、贏得主動(dòng)權(quán)具有重要意義。
全球具身智能技術(shù)發(fā)展呈五大態(tài)勢(shì)
當(dāng)前,全球具身智能技術(shù)呈現(xiàn)加速演進(jìn)態(tài)勢(shì),感知交互、決策認(rèn)知、控制執(zhí)行、虛實(shí)域數(shù)據(jù)融合與系統(tǒng)集成五大維度協(xié)同突破,正推動(dòng)具身智能從實(shí)驗(yàn)室走向規(guī)?;瘧?yīng)用。
一是世界模型內(nèi)嵌,感知交互躍遷。在世界模型和多模態(tài)感知技術(shù)的驅(qū)動(dòng)下,具身智能對(duì)物理環(huán)境的理解與交互能力顯著躍升,實(shí)現(xiàn)從“刺激—響應(yīng)”到“推演式?jīng)Q策”、從數(shù)據(jù)重組到規(guī)律理解的范式躍遷。Meta公司推出V-JEPA2世界模型,可預(yù)判不同行為后果,依據(jù)目標(biāo)作優(yōu)劣排序,行動(dòng)準(zhǔn)確性大幅提升。北京大學(xué)提出MLA多感官語言動(dòng)作模型架構(gòu),引入完備多感官模態(tài),通過整合異構(gòu)信號(hào)提供更可靠的決策依據(jù)。
二是端到端成趨勢(shì),決策范式革新。具身智能“大腦+小腦”分層決策架構(gòu)已成熟,應(yīng)用越來越廣;端到端模型憑借廣覆蓋、低時(shí)延、高自主、強(qiáng)協(xié)同的優(yōu)勢(shì),在具身智能走向通用泛化的探索中展現(xiàn)出很大潛力。Google DeepMind的Gemini Robotics依托端到端VLA架構(gòu),跨本體泛化能力出色;國(guó)內(nèi)越疆自研的DOBOT-VLA模型融合視、語、控能力,經(jīng)實(shí)景強(qiáng)化學(xué)習(xí)優(yōu)化,搭載了其的人形機(jī)器人ATOM已于2025年實(shí)現(xiàn)量產(chǎn),可完成行走、動(dòng)態(tài)平衡與精密裝配等復(fù)雜作業(yè)。
三是柔性材料突破,自愈能力涌現(xiàn)。材料革命正推動(dòng)具身智能由“剛性執(zhí)行末端”向“智能適應(yīng)本體”演進(jìn)。類膚觸覺傳感器與電子皮膚讓具身智能擁有高靈敏的環(huán)境感知能力,仿生柔性結(jié)構(gòu)賦予具身智能類生命體爬行、滾動(dòng)、蠕動(dòng)等多模態(tài)運(yùn)動(dòng)能力,有效適應(yīng)并拓寬了應(yīng)用場(chǎng)景。自修復(fù)材料實(shí)現(xiàn)主動(dòng)自愈突破,本體受損后可在光、熱作用下實(shí)現(xiàn)化學(xué)鍵可逆重組,集損傷檢測(cè)、定位與自愈功能于一體,大幅提升具身智能在復(fù)雜惡劣環(huán)境下的耐久度與可靠性,保障長(zhǎng)期自主作業(yè)。
四是虛實(shí)數(shù)據(jù)融合,統(tǒng)一數(shù)據(jù)標(biāo)尺。真機(jī)數(shù)據(jù)采集成本高、規(guī)模小,對(duì)未見環(huán)境泛化能力較弱,已成為具身智能發(fā)展的瓶頸。生成式數(shù)據(jù)源自大模型創(chuàng)建的仿真環(huán)境,體量大、結(jié)構(gòu)化程度高,可低成本填補(bǔ)數(shù)據(jù)鴻溝,結(jié)合物理規(guī)律約束和混合數(shù)據(jù)范式,并以真機(jī)數(shù)據(jù)校準(zhǔn),能夠顯著縮小仿真與現(xiàn)實(shí)的差距。國(guó)內(nèi)企業(yè)51Sim基于英偉達(dá)平臺(tái)積累端到端輔助駕駛場(chǎng)景及合成數(shù)據(jù),成功用于港口、礦山等復(fù)雜場(chǎng)景的機(jī)器人訓(xùn)練。“穹頂—DOME”平臺(tái)統(tǒng)一數(shù)據(jù)接口與格式規(guī)范,打破數(shù)據(jù)孤島,構(gòu)建產(chǎn)業(yè)通用語言,有力推動(dòng)跨場(chǎng)景互操作與高質(zhì)量數(shù)據(jù)供給。
五是實(shí)現(xiàn)異構(gòu)協(xié)同,筑牢安全底座。軟硬件解耦與模塊化集成,正推動(dòng)具身智能操作系統(tǒng)加速實(shí)現(xiàn)跨本體兼容與異構(gòu)協(xié)同。OpenRMF架構(gòu)統(tǒng)一機(jī)器人“交通規(guī)則”與“溝通語言”,實(shí)現(xiàn)異構(gòu)機(jī)群的協(xié)同作業(yè);OpenMind公司推出的OM1支持主流大模型API的即插即用與跨本體開發(fā)。系統(tǒng)集成筑牢工程底座,安全可信守牢底線約束。對(duì)抗訓(xùn)練、差分隱私等隱私計(jì)算技術(shù)可在不泄露原始數(shù)據(jù)的前提下實(shí)現(xiàn)跨機(jī)構(gòu)協(xié)作,為具身智能規(guī)?;瘧?yīng)用構(gòu)筑主動(dòng)安全的縱深防御體系。
多措并舉增強(qiáng)我國(guó)具身智能競(jìng)爭(zhēng)力
當(dāng)前,我國(guó)具身智能正處于技術(shù)突破、產(chǎn)業(yè)導(dǎo)入和生態(tài)培育協(xié)調(diào)并進(jìn)的關(guān)鍵階段。核心硬件國(guó)產(chǎn)化提速,大模型性能大幅增強(qiáng),國(guó)產(chǎn)算力可高效承載復(fù)雜模型,部分領(lǐng)域初步形成應(yīng)用能力。但隨著國(guó)際競(jìng)爭(zhēng)的日益激烈,具身智能的深層挑戰(zhàn)也不容忽視。
一是核心零部件自主可控度有待提高,伺服電機(jī)、減速器、高端傳感器對(duì)外依存度高,能源系統(tǒng)續(xù)航能力不足,全棧自研能力仍存弱項(xiàng);二是標(biāo)準(zhǔn)體系與產(chǎn)業(yè)生態(tài)尚待完善,硬件接口、通信協(xié)議、軟件兼容標(biāo)準(zhǔn)不統(tǒng)一,數(shù)據(jù)孤島現(xiàn)象普遍,開源社區(qū)影響力有限,高質(zhì)量交互數(shù)據(jù)供給不足;三是安全治理體系仍需完善,自主系統(tǒng)事故責(zé)任劃分難以界定,敏感數(shù)據(jù)持續(xù)采集易引發(fā)數(shù)據(jù)泄露和隱私侵權(quán)等風(fēng)險(xiǎn),跨機(jī)構(gòu)協(xié)作的可信機(jī)制有待健全。
面對(duì)上述挑戰(zhàn),我國(guó)應(yīng)搶抓發(fā)展窗口期,以自主創(chuàng)新為核心、標(biāo)準(zhǔn)建設(shè)為抓手、安全治理為底線,加快培育具身智能產(chǎn)業(yè)生態(tài),為發(fā)展新質(zhì)生產(chǎn)力、建設(shè)科技強(qiáng)國(guó)注入強(qiáng)勁動(dòng)能。
一是強(qiáng)化戰(zhàn)略科技力量布局,夯實(shí)自主創(chuàng)新根基。依托新型舉國(guó)體制,強(qiáng)化全國(guó)重點(diǎn)實(shí)驗(yàn)室等在具身智能領(lǐng)域的戰(zhàn)略科技力量作用,圍繞“信息—物理—認(rèn)知”三域融合大模型、端到端決策架構(gòu)、仿生柔性材料等前沿方向開展有組織科研。深化企業(yè)主導(dǎo)的產(chǎn)學(xué)研融合,支持科技領(lǐng)軍企業(yè)牽頭組建創(chuàng)新聯(lián)合體,集中優(yōu)勢(shì)資源突破伺服電機(jī)、減速器、行星滾柱絲杠等核心零部件國(guó)產(chǎn)化瓶頸,貫通“基礎(chǔ)研究—技術(shù)開發(fā)—產(chǎn)業(yè)應(yīng)用”全鏈條,從源頭破除產(chǎn)業(yè)發(fā)展桎梏。
二是構(gòu)建開放協(xié)同的產(chǎn)業(yè)生態(tài),以高標(biāo)準(zhǔn)引領(lǐng)高質(zhì)量發(fā)展。加快制定跨行業(yè)硬件接口、通信協(xié)議與軟件兼容標(biāo)準(zhǔn),推進(jìn)操作系統(tǒng)、中間件等基礎(chǔ)軟件自主可控。探索建立高層級(jí)數(shù)據(jù)匯聚與治理主體,制定多模態(tài)數(shù)據(jù)采集與標(biāo)注規(guī)范,建設(shè)面向智能制造、高危作業(yè)等重點(diǎn)場(chǎng)景的仿真基準(zhǔn)與數(shù)據(jù)開放平臺(tái),破除數(shù)據(jù)流通壁壘。大力培育本土開源生態(tài),鼓勵(lì)高校、科研院所與企業(yè)共建算法算力共享體系,降低研發(fā)門檻,加速技術(shù)迭代,以高水平標(biāo)準(zhǔn)化和開源化引領(lǐng)產(chǎn)業(yè)提質(zhì)升級(jí)。
三是健全安全治理體系,筑牢可信發(fā)展根基。構(gòu)建涵蓋算法、數(shù)據(jù)、物理安全的分級(jí)防護(hù)機(jī)制,明晰生產(chǎn)、使用、算法供給、監(jiān)管各方權(quán)責(zé)邊界。前瞻研究事故責(zé)任認(rèn)定、跨機(jī)構(gòu)協(xié)作互信等治理規(guī)則,規(guī)范具身導(dǎo)航、群體協(xié)同等行為的安全與倫理準(zhǔn)則。探索包容審慎的監(jiān)管模式,開展全生命周期安全倫理評(píng)估,搭建主動(dòng)安全的縱深防御體系,為具身智能規(guī)模化落地、長(zhǎng)效健康發(fā)展提供制度保障。
(作者鄭君倢、黃寧 工作單位為中國(guó)科學(xué)技術(shù)發(fā)展戰(zhàn)略研究院)
原標(biāo)題:把握全球技術(shù)演進(jìn)態(tài)勢(shì) 搶占具身智能發(fā)展先機(jī)
責(zé)任編輯:趙宇
網(wǎng)頁編輯:蘇偉