具身智能能夠以主人公的視角去自主感知物理世界,不再僅僅被動地等待數(shù)據(jù)投喂,而是通過與環(huán)境的交互不斷學(xué)習(xí)和積累經(jīng)驗,用擬人化的思維路徑去理解和適應(yīng)環(huán)境。
一、具身智能概述
1.具身智能的定義
具身智能,是指人工智能+機器人等物理實體。按使用用途和場景的不同,具身智能可以有多種形態(tài),包括各類智能機器人,如人形機器人、仿生機器人、自動駕駛等。
人工智能(能力)是智能機器所執(zhí)行的通常與人類智能有關(guān)的智能行為。這些智能行為涉及學(xué)習(xí)、感知、思考、理解、識別、判斷、推理、證明、通信、設(shè)計、規(guī)劃、行動和問題求解等活動。具身智能特別強調(diào)智能的提升,不僅通過算法和計算實現(xiàn)智能,更通過本體與環(huán)境的交互實現(xiàn)智能并不斷提升智能。
《中國大百科全書》對機器人的定義為:能靈活地完成特定的操作和運動任務(wù),并可再編程序的多功能操作器。按照這一定義,機器人包含多種形態(tài),例如人形機器人、機械臂、仿生機器人,球形機器人等。
2.具身智能商業(yè)化模式
具身智能想要具備高泛化性和可靠性,需要在真實物理世界里獲取數(shù)據(jù)來完善模型,而獲取真實物理世界的數(shù)據(jù)的關(guān)鍵就在于商業(yè)化落地。根據(jù)1XAI副總裁Eric Jang在個人博客網(wǎng)站上發(fā)表的“All Roads Lead to Robotics”一文,具身智能的商業(yè)化路徑主要包括三種:通用場景軟硬結(jié)合、軟件路徑、以及垂直領(lǐng)域軟硬結(jié)合。通用路線技術(shù)難度高,商業(yè)模式是向B端或C端銷售帶有智能能力的完整的機器人。軟件路徑能夠?qū)崿F(xiàn)機器人的快速部署和迭代,商業(yè)模式主要是向硬件廠商或綜合型廠商提供API接口。垂直領(lǐng)域軟硬結(jié)合路徑下,機器人硬件與數(shù)據(jù)強綁定,公司能夠收集和處理特定類型的數(shù)據(jù)。
5.具身智能產(chǎn)業(yè)鏈全景圖譜
具身智能產(chǎn)業(yè)鏈較長。上游主要為原材料和零部件供應(yīng);中游為本體制造與系統(tǒng)集成;下游為具身智能的應(yīng)用領(lǐng)域。
二、具身智能行業(yè)發(fā)展政策
國家頻繁發(fā)布關(guān)于機器人和人工智能的相關(guān)政策,特別關(guān)注具身智能這一產(chǎn)業(yè)的關(guān)鍵領(lǐng)域。《輕工業(yè)數(shù)字化轉(zhuǎn)型實施方案(征求意見稿)》《關(guān)于規(guī)范中央企業(yè)采購管理工作的指導(dǎo)意見》和《國家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南》(征求意見稿)等政策的發(fā)行,為具身智能行業(yè)發(fā)展提供了環(huán)境。
三、具身智能行業(yè)現(xiàn)狀
1.人形機器人潛在市場規(guī)模
AI下一個浪潮將是“具身智能”,潛在萬億賽道前景廣闊。2024年5月16日,NVIDIA(英偉達(dá))創(chuàng)始人黃仁勛表示,下一波人工智能浪潮是“具身人工智能”。以人形機器人為例,至2024年,中國人形機器人市場規(guī)模將達(dá)到約27.6億元。到2029年,該市場規(guī)模有望擴大至750億元,占據(jù)全球市場的32.7%。此外,報告還進(jìn)一步展望,到2035年,中國人形機器人市場規(guī)模有望達(dá)到3000億元。
2.人形機器人主要產(chǎn)品形態(tài)
人形機器人作為具身智能的典型代表,被視為實現(xiàn)具身智能的最佳載體之一。
3.人形機器人產(chǎn)品案例——特斯拉Optimus
特斯拉Optimus機器人身高172cm,體重73kg,全身自由度共28個(不含靈巧手),用電功率靜坐/慢走時為100/500W;能夠硬拉68公斤,負(fù)重20公斤,擁有媲美人類的手和工作能力,可完成在工廠搬運箱、澆水植物、移動金屬棒等復(fù)雜動作。
2022年特斯拉AI Day,馬斯克預(yù)計到2025-2027年Optimus售價將控制在2萬美元以內(nèi),成本大幅下降,市場空間遠(yuǎn)期或超汽車業(yè)務(wù)。
4.具身智能重點企業(yè)布局
具身智能行業(yè)作為人工智能與機器人技術(shù)深度融合的新興領(lǐng)域,吸引了眾多企業(yè)紛紛布局,以下是相關(guān)企業(yè)的布局概述:
5.具身智能企業(yè)分布情況
具身智能行業(yè)企業(yè)主要集中在東部沿海地區(qū)和部分中部地區(qū)。北京、上海、浙江、廣東和安徽等地是企業(yè)分布較為密集的區(qū)域。廣東成為具身智能高地,眾多科技企業(yè)、整車廠商和機器人廠商,紛紛布局大模型,自動駕駛和機器人。
四、具身智能重點企業(yè)分析
1.宇樹科技
杭州宇樹科技是一家世界知名的民用機器人公司,專注于消費級、行業(yè)級高性能通用足式/人形機器人及靈巧機械臂的自主研發(fā)、生產(chǎn)和銷售。
宇樹高度重視自主研發(fā)和科技創(chuàng)新,全自研電機、減速器、控制器、激光雷達(dá)等機器人關(guān)鍵核心零部件和高性能感知及運動控制算法,整合機器人全產(chǎn)業(yè)鏈,在足式機器人領(lǐng)域達(dá)到全球技術(shù)領(lǐng)先。目前累計申請國內(nèi)外專利180余項,授權(quán)專利150余項。
目前公司產(chǎn)品包括:幾款機器狗和2款人形機器人。宇樹H1在2023/8/15發(fā)布,2023年Q4左右發(fā)貨,預(yù)計售價幾十萬人民幣以內(nèi),定位是通用人形機器人。身高180cm,體重47kg,步行速度>1.5m/s,潛在運動能力>5m/s。自由度:單腿5(髖*3+膝*1+踝*1)*2+單臂4*2+靈巧手選配(在研)。搭配自研M107關(guān)節(jié)電機,峰值扭矩密度89Nm/kg,最大關(guān)節(jié)扭矩360Nm,采用中空走線。
2.優(yōu)必選
深圳市優(yōu)必選科技股份有限公司成立于2012年3月31日,為一家總部位于中國的知名機器人公司,致力于智能服務(wù)機器人及智能服務(wù)機器人解決方案的設(shè)計、生產(chǎn)、商業(yè)化、銷售及營銷以及研發(fā)。公司的產(chǎn)品在不同程度上配備了感知、交互、分析及處理人類指令及外部環(huán)境(如建圖、溫度測量及人臉識別)的智能功能,范圍涵蓋消費級機器人及電器,針對教育、物流及其他行業(yè)定制的企業(yè)級智能服務(wù)機器人及智能服務(wù)機器人解決方案。
根據(jù)2023年公司財報,優(yōu)必選2023年實現(xiàn)營業(yè)收入10.56億元,歸母凈利潤-12.34億元。
2023年優(yōu)必選營收構(gòu)成中,36.9%由物流智能機器人及智能機器人解決方案創(chuàng)造,32.9%由教育智能機器人及智能機器人解決方案創(chuàng)造,24%由消費級機器人及其他硬件設(shè)備創(chuàng)造,5.9%由其他產(chǎn)業(yè)定制智能機器人及智能機器人解決方案創(chuàng)造。
3.智元機器人
上海智元新創(chuàng)技術(shù)有限公司成立于2023年2月,是一家致力于以AI+機器人的融合創(chuàng)新、打造世界級領(lǐng)先的具身智能機器人產(chǎn)品及應(yīng)用生態(tài)的創(chuàng)新企業(yè)。創(chuàng)始團(tuán)隊包括“稚暉君”彭志輝在內(nèi)的多位業(yè)內(nèi)資深人士,背景綜合互補,具有深厚的核心技術(shù)背景、產(chǎn)業(yè)管理經(jīng)驗和產(chǎn)業(yè)資源。截止到目前智元機器人已完成了天使輪、A輪、A1輪、A1+輪、A2輪、A3輪、A4輪等多輪融資。2023年8月,智元機器人發(fā)布第一代通用型具身智能機器人原型機——遠(yuǎn)征A1;2024年8月,智元機器人家族系列商用產(chǎn)品發(fā)布,在交互服務(wù)、柔性智造、特種作業(yè)、科研教育及數(shù)據(jù)采集等場景開啟商用量產(chǎn)。
8月18日,智元機器人在2024年度新品發(fā)布會“智元遠(yuǎn)征商用啟航”上,發(fā)布了“遠(yuǎn)征”與“靈犀”兩大家族共計五款商用人形機器人新品,包括:遠(yuǎn)征A2、遠(yuǎn)征A2-W、遠(yuǎn)征A2-Max、靈犀X1及靈犀X1-W。其中,遠(yuǎn)征A2、遠(yuǎn)征A2-Max及靈犀X1為雙足人形機器人,遠(yuǎn)征A2-W及靈犀X1-W為輪式機器人。輪式與足式兩種形態(tài)的結(jié)合下,智元機器人家族有望覆蓋交互服務(wù)、柔性智造、特種作業(yè)、科研教育和數(shù)據(jù)采集等多種類應(yīng)用場景。此外,智元還公布了在機器人動力域、感知域、通信域、控制域一系列自主研發(fā)的技術(shù)成果及具身智能數(shù)據(jù)系統(tǒng)AIDEA。其中,WaIker X高130厘米,重63kg,自由度41個,能夠?qū)崿F(xiàn)復(fù)雜地形自適應(yīng)平穩(wěn)快速行走,具備多模態(tài)情感交互仿人共情表達(dá)能力。優(yōu)必選CTO熊友軍表示,Walker正按照規(guī)劃推進(jìn)商業(yè)化應(yīng)用,最終的目標(biāo)是走入家庭。
4.小米集團(tuán)-W
小米科技2024年3月28日正式推出智能電動汽車。其業(yè)務(wù)分部為手機×AIoT(智能手機、loT與生活消費產(chǎn)品、互聯(lián)網(wǎng)服務(wù)與其他相關(guān)業(yè)務(wù))和智能電動汽車等創(chuàng)新業(yè)務(wù)。
小米CyberOne身高177CM,體重52KG,最大模組峰值扭矩300Nm,峰值功率密度96Nm/kg,全身自由度為21,時速可達(dá)3.6km/h。CyberOne配備Mi-Sense視覺空間系統(tǒng)模塊,8米內(nèi)深度信息精度達(dá)1%;可識別85種環(huán)境語義和6類45種人類情感。雷軍表示,鐵大還需要漫長時間去學(xué)習(xí)完善,目前一臺機器人的成本高達(dá)六七十萬,尚無法量產(chǎn)。
根據(jù)2024年第三季度財報,小米集團(tuán)2024年前3季度實現(xiàn)營業(yè)收入2569億元,歸母凈利潤146.3億元。
第3季度,小米實現(xiàn)營收925.07億元。其中,智能手機創(chuàng)造營業(yè)收入474.52億元,占比51.30%;loT與生活消費產(chǎn)品創(chuàng)造營收261.02億元,占比28.22%;智能電動汽車等創(chuàng)新業(yè)務(wù)創(chuàng)造營收96.97億元,占比10.48%;互聯(lián)網(wǎng)服務(wù)創(chuàng)造84.62億元,占比9.15%;其他相關(guān)服務(wù)創(chuàng)造7.92億元,占比0.86%。
5.科大訊飛
科大訊飛股份有限公司是一家專業(yè)從事語音及語言、自然語言理解、機器學(xué)習(xí)推理及自主學(xué)習(xí)等人工智能核心技術(shù)研究,人工智能產(chǎn)品研發(fā)和行業(yè)應(yīng)用落地的國家級骨干軟件企業(yè)。公司主要產(chǎn)品和服務(wù)為訊飛開放平臺及消費者業(yè)務(wù)、智慧教育、智慧醫(yī)療、智慧城市、智慧金融、智慧汽車。
科大訊飛機器人開放平臺旨在賦能機器人硬件,快速接入AI能力,并提供可視化開發(fā)機器人業(yè)務(wù)以及項目管控和運營監(jiān)測能力。實現(xiàn)可復(fù)用化、服務(wù)統(tǒng)一化、流程角色優(yōu)化、運營監(jiān)控化和資源管控化,使平臺成為一個強大的機器人能力支持中心。最終依托機器人開放平臺,賦能于機器人產(chǎn)業(yè)公司,建立機器人合作生態(tài),推動機器人產(chǎn)業(yè)持續(xù)健康快速的發(fā)展。
機器人超腦平臺,更強調(diào)多模態(tài)感知交互和基于大模型的機器人大腦。依托科大訊飛超腦2030技術(shù)底座,面向物理世界、數(shù)字世界和元宇宙,推出以AI能力星云、多模態(tài)交互、智能運動、模型訓(xùn)練、資產(chǎn)生成和軟硬件接入為核心的機器人開發(fā)平臺,幫助開發(fā)者快速搭建懂知識、善學(xué)習(xí)、能進(jìn)化的實體機器人和虛擬數(shù)字人產(chǎn)品,讓機器人走進(jìn)每個行業(yè)和家庭。
根據(jù)2023年公司財報,科大訊飛實現(xiàn)營業(yè)收入196.5億元,歸母凈利潤6.57億元。
按照產(chǎn)品分類,科大訊飛2023年營業(yè)收入28.31由教育產(chǎn)品和服務(wù)創(chuàng)造;20.04%由開放平臺創(chuàng)造;10.67%由運營商相關(guān)業(yè)務(wù)創(chuàng)造;9.6%由信息工程創(chuàng)造。
五、發(fā)展趨勢
1.政策支持
人形機器人是具身智能理想形態(tài)。國家明確人形機器人戰(zhàn)略意義:“有望成為及計算機、智能手機、新能源汽車后的顛覆性產(chǎn)品,將深刻變革人類生產(chǎn)生活方式,重塑全球產(chǎn)業(yè)發(fā)展格局”國家頂層明確部署了人形機器人中短期戰(zhàn)略路徑,并通過制定多項關(guān)鍵任務(wù)(技術(shù)、產(chǎn)品、場景、生態(tài)等)清晰引導(dǎo)未來產(chǎn)業(yè)發(fā)展方向。
2.與大模型的結(jié)合
大模型促使智能體從被動的編程控制朝著主動決策轉(zhuǎn)變。當(dāng)與智能體相結(jié)合后,具身智能以任務(wù)目標(biāo)作為導(dǎo)向,不再只是機械地執(zhí)行程序。它能夠依據(jù)環(huán)境的變化,對行動細(xì)節(jié)進(jìn)行實時調(diào)整,從而消除了在特定條件下針對特定任務(wù)反復(fù)編程的必要。憑借大模型的涌現(xiàn)能力,具身智能可以從原始訓(xùn)練數(shù)據(jù)中學(xué)習(xí)并挖掘出新的特征與模式,即便僅僅依靠網(wǎng)絡(luò)數(shù)據(jù)知識,也能夠針對從未見過的對象或場景執(zhí)行操作任務(wù)。
3.功能持續(xù)進(jìn)化
相比于傳統(tǒng)基于AI視覺及特定場景預(yù)訓(xùn)練的機器人,具身智能的突出特點是:一是不再依賴預(yù)定義的復(fù)雜邏輯來管理場景;二是能形成學(xué)習(xí)進(jìn)化機制,持續(xù)獲取交互反饋來實現(xiàn)環(huán)境自適應(yīng);三是能通過身體與環(huán)境交互產(chǎn)生新的交互數(shù)據(jù),并用于實現(xiàn)智能增長。在這樣的功能加持下,具身智能將能實現(xiàn)持續(xù)的智能進(jìn)化。