聯系我們
——
咨詢與建議
——
友(yǒu)情鏈接
——
區(qū)塊鏈是500年來(lái)金融領域最偉大(dà)的發明(míng)
——華爾街(jiē)日報 2015.1.24-25
行(xíng)業資訊
——
News centre
人(rén)形機器(qì)人(rén)的通(tōng)用之戰
不論你(nǐ)接受與否,人(rén)工智能技(jì)術(shù)已經開(kāi)始對于現實世界的重重改造。
消費電(diàn)子領域,手機和(hé)電(diàn)腦(nǎo)廠商們正在将不同種類的AI大(dà)模型,植入到各種終端産品中。這些(xiē)公司普遍認為(wèi),AI能極大(dà)程度地改善困于創新瓶頸中的行(xíng)業現狀,重新激發用戶的購買需求。汽車(chē)行(xíng)業,特斯拉4月初向全美國的170萬車(chē)主推送了FSD(完全自動駕駛)正式版本,端到端的神經網絡AI系統讓駕駛決策更像人(rén)類司機,比如連續跨越4車(chē)道(dào)轉向。更為(wèi)重要的是,目前為(wèi)止特斯拉FSD還(hái)沒有(yǒu)被曝出發生(shēng)任何重大(dà)事故。
AI的下一站(zhàn)會(huì)在哪?習慣于捕捉趨勢的風險投資人(rén),開(kāi)始在人(rén)形機器(qì)人(rén)行(xíng)業集結共識。
在中國的一級市場(chǎng),2023年10月,人(rén)形機器(qì)人(rén)初創公司逐際動力完成近2億元的天使和(hé)Pre-A輪融資;同年12月,成立不到一年的智元機器(qì)人(rén)拿(ná)到6億元的融資資金;2024年1月,成立不足半年的星動紀元宣布完成過億元天使輪融資;2024年2月,宇樹(shù)科技(jì)完成B2輪融資,金額達到10億元。
“中國機器(qì)人(rén)行(xíng)業的發展經曆了好幾輪起伏。2013-2014年,工業機器(qì)人(rén)的投資開(kāi)始起步;2016-2017年,協作(zuò)式機器(qì)人(rén)領域又掀起了一輪投資熱潮。從2022年開(kāi)始,通(tōng)用人(rén)形機器(qì)人(rén)成為(wèi)了行(xíng)業關注的焦點。”
峰瑞資本副總裁顔黔杭對钛媒體(tǐ)APP表示,中國國産工業機器(qì)人(rén)的市場(chǎng)滲透率已經達到了1/3左右,整個(gè)機器(qì)人(rén)行(xíng)業正在逐步成熟。而 AI 大(dà)模型産生(shēng)的質變,讓大(dà)家(jiā)意識到機器(qì)人(rén)的智能化程度會(huì)越來(lái)越高(gāo),并逐步通(tōng)用化。
至于通(tōng)用人(rén)形機器(qì)人(rén)何時(shí)能夠真正走上(shàng)産線、走進家(jiā)門(mén),行(xíng)業內(nèi)的創業公司則有(yǒu)着不同的判斷。逐際動力方面認為(wèi),通(tōng)用人(rén)形機器(qì)人(rén)要代替産線上(shàng)人(rén)類的精細操作(zuò),還(hái)需要5-8年;真正走向家(jiā)用市場(chǎng),則需要8到10年。宇樹(shù)科技(jì)的創始人(rén)王興興則對钛媒體(tǐ)APP表示,“2025年底前,更加通(tōng)用化的人(rén)形機器(qì)人(rén)會(huì)出現,我感覺已經看到了方向。”
1、馬斯克,一呼百應
是什麽點燃了人(rén)形機器(qì)人(rén)的“這把火(huǒ)”?幾乎所有(yǒu)的受訪者都給出了一緻的答(dá)案,那(nà)就是特斯拉的創始人(rén)——埃隆·馬斯克。
2022年2月,特斯拉完成了Optimus開(kāi)發平台制(zhì)造;7個(gè)月後的特斯拉人(rén)工智能日2.0上(shàng),馬斯克帶着Optimus平台研發的擎天柱機器(qì)人(rén)原型亮相,該款機器(qì)人(rén)已能夠獨立行(xíng)走和(hé)搬運物品。2023年年底,第二代Optimus正式亮相,重量減輕10千克、行(xíng)走速度提高(gāo)30%,并擁有(yǒu)更靈巧的手和(hé)自由度更高(gāo)的脖子。
馬斯克入局之後,人(rén)形機器(qì)人(rén)的創業潮被徹底引爆。
2023年以來(lái),包括宇樹(shù)H1、智元遠征A1、傅利葉GR—1、星動紀元“小(xiǎo)星”、逐際動力CL—1、小(xiǎo)鵬PX5在內(nèi)的一批國內(nèi)人(rén)形機器(qì)人(rén)産品被推出。二級市場(chǎng),被稱為(wèi)國內(nèi)“人(rén)形機器(qì)人(rén)*股”的優必選,盤中股價一度上(shàng)漲超過88%,盡管這家(jiā)公司目前的主要收入來(lái)源并非人(rén)形機器(qì)人(rén)産品。
海外市場(chǎng),2023年5月,挪威人(rén)形機器(qì)人(rén)初創公司1X宣布完成由OpenAI領投的2350萬美元A2輪融資。幾乎同時(shí),美國人(rén)形機器(qì)人(rén)公司Figure拿(ná)到了7000萬美元A輪融資。2024年1月,1X再次完成1億美元B輪融資,投資方包括EQT Ventures和(hé)三星NEXT等。一個(gè)月之後,Figure宣布完成6.75億美元B輪融資,投資方包括微軟、OpenAI、英偉達等。
“2022年,OpenAI還(hái)沒有(yǒu)發布ChatGPT,但(dàn)馬斯克可(kě)能先于行(xíng)業看到了GPT的能力。”
王興興對钛媒體(tǐ)APP表示,馬斯克之前不論是在汽車(chē)行(xíng)業還(hái)是商業航天領域,都證明(míng)了他的成功。因此,當馬斯克開(kāi)始做(zuò)人(rén)形機器(qì)人(rén)之後,政府、市場(chǎng)、資本機構都認為(wèi)必須加快入場(chǎng),不能等特斯拉真正做(zuò)出來(lái)了大(dà)家(jiā)再去追。當然,人(rén)形機器(qì)人(rén)受到關注的更本質原因是,AI大(dà)模型的出現。
據王興興介紹,此前宇樹(shù)科技(jì)并未有(yǒu)涉足人(rén)形機器(qì)人(rén)賽道(dào)的想法,因為(wèi)人(rén)形機器(qì)人(rén)太複雜,用傳統算(suàn)法根本沒辦法駕馭這種複雜機器(qì)。但(dàn)是,目前AI技(jì)術(shù)的發展已經遠超其預期。比如,以前一到兩年才能讓人(rén)形機器(qì)人(rén)學會(huì)走路,現在利用AI算(suàn)法訓練一個(gè)月就可(kě)以實現。
“傳統人(rén)形機器(qì)人(rén)的訓練算(suàn)法,相當于是靠一些(xiē)聰明(míng)的人(rén)類大(dà)腦(nǎo)去寫一些(xiē)數(shù)學方程式,然後去求解這個(gè)方程,制(zhì)定機器(qì)人(rén)的運動軌迹。但(dàn)這些(xiē)方程式有(yǒu)很(hěn)大(dà)的局限性,一旦環境出現變化,可(kě)能就沒法用了,需要重新設計(jì)新的方程式。”
王興興進一步解釋稱,這樣的訓練方式會(huì)導緻代碼量非常大(dà),而且當系統複雜到一定程度,單純靠人(rén)力是無法維護這個(gè)系統的。但(dàn)是對于AI來(lái)說,隻要模型搭建得(de)足夠好,然後不斷給AI投喂數(shù)據和(hé)算(suàn)力,AI就可(kě)以不斷地試錯。利用強化學習算(suàn)法中的獎勵機制(zhì),AI就能自動把好的訓練結果留下來(lái),壞的扔掉,訓練效率得(de)到質的提升。
靠着AI帶來(lái)的效率提升,宇樹(shù)科技(jì)僅花(huā)了半年的時(shí)間(jiān),就推出了旗下的*款人(rén)形機器(qì)人(rén)産品。在2024年GTC大(dà)會(huì)“壓軸”環節,英偉達CEO黃仁勳與九個(gè)人(rén)形機器(qì)人(rén)一起登場(chǎng)。其中,左起第二個(gè)人(rén)形機器(qì)人(rén)就是是宇樹(shù)科技(jì)旗下的Unitree H1。
需要注意的是,人(rén)形機器(qì)人(rén)的這波熱潮,甚至倒逼了該領域的鼻祖——波士頓動力,做(zuò)出改變。
波士頓動力是一家(jiā)美國的工程與機器(qì)人(rén)設計(jì)公司,成立于1992年。2013年,波士頓動力在美國國防部競賽中公布了人(rén)形機器(qì)人(rén)Atlas 。
多(duō)次叠代之後,Atlas可(kě)以實現完成各種複雜動作(zuò),比如快速奔跑、360 度旋轉跳(tiào)躍、翻越障礙物等。運動控制(zhì)方面,Atlas采用的正是“大(dà)量方程式求解”的傳統算(suàn)法,并由液壓裝置提供動力。
“Atlas之前披露過的成本是200萬美元左右一台。而目前市面上(shàng)在售的人(rén)形機器(qì)人(rén),宇樹(shù)科技(jì)的産品售價約為(wèi)60萬元,傅利葉則為(wèi)100萬元左右。”星動紀元聯合創始人(rén)席悅對钛媒體(tǐ)APP表示,這就是波士頓動力和(hé)新一代人(rén)形機器(qì)人(rén)在成本上(shàng)的巨大(dà)差距。
2024年4月16日,波士頓動力宣布液壓版Atlas正式“退役”。之後,波士頓動力推出了新款全電(diàn)動Atlas,和(hé)目前所有(yǒu)的人(rén)形機器(qì)人(rén)産品一樣,利用電(diàn)池提供動力來(lái)源。接下來(lái)的控制(zhì)算(suàn)法,波士頓動力大(dà)概率也會(huì)引用效率更高(gāo)的AI模型。
2、三大(dà)未解之題:大(dà)腦(nǎo)、小(xiǎo)腦(nǎo)和(hé)本體(tǐ)
“人(rén)形機器(qì)人(rén)現在的熱度,相當于是一個(gè)小(xiǎo)火(huǒ)苗,才剛剛開(kāi)始燃燒起來(lái)。如果AI和(hé)硬件每年都持續叠代,這個(gè)行(xíng)業對于現實世界的颠覆将會(huì)非常強。”
王興興表示,到明(míng)年年底前,全球至少(shǎo)有(yǒu)一家(jiā)公司可(kě)以把比較通(tōng)用的機器(qì)人(rén)大(dà)模型開(kāi)發出來(lái)。這個(gè)基礎大(dà)模型就像是一個(gè)完整的積木,大(dà)語言模型隻是其中一塊,其他組成部分還(hái)包括視(shì)覺感知、力覺感知、決策和(hé)交互等。
不過,這樣的判斷在人(rén)形機器(qì)人(rén)行(xíng)業中還(hái)未達成共識。更主流的觀點認為(wèi),人(rén)形機器(qì)人(rén)想要實現更大(dà)程度的通(tōng)用化,需要在大(dà)腦(nǎo)、小(xiǎo)腦(nǎo)和(hé)本體(tǐ)上(shàng)同時(shí)取得(de)突破,這在短(duǎn)時(shí)間(jiān)內(nèi)幾乎是無法完成的。
所謂大(dà)腦(nǎo),指的是機器(qì)人(rén)的理(lǐ)解能力,也就是機器(qì)人(rén)對于人(rén)類指令的理(lǐ)解以及環境感知。小(xiǎo)腦(nǎo),是指機器(qì)人(rén)的精細化運動控制(zhì)能力;本體(tǐ),則是構成人(rén)形機器(qì)人(rén)原型的各類零部件,比如關節、四肢、頭等。
“大(dà)模型的出現,主要提升了機器(qì)人(rén)的大(dà)腦(nǎo)能力。”峰瑞資本執行(xíng)董事劉鵬琦對钛媒體(tǐ)APP表示。
顔黔杭則對钛媒體(tǐ)APP稱,但(dàn)就像“缸中之腦(nǎo)”一樣,現在大(dà)模型隻是一個(gè)向外輸入和(hé)輸出語言類或者多(duō)模态信息的大(dà)腦(nǎo),獨立于機器(qì)或本體(tǐ)存在。未來(lái)大(dà)模型到底應該接入什麽樣的身體(tǐ),才能完全發揮通(tōng)用化功能?目前,不管是投資人(rén)還(hái)是創業者,大(dà)家(jiā)都在探索的一個(gè)過程中。
而在小(xiǎo)腦(nǎo)方面,目前的人(rén)形機器(qì)人(rén)已經在直立行(xíng)走方面取得(de)了長足的進展,不論是平地還(hái)還(hái)是崎岖的山(shān)路。在細分場(chǎng)景中,Figure 01成為(wèi)了*個(gè)“拿(ná)起蘋果”的人(rén)形機器(qì)人(rén);斯坦福團隊的Mobile ALOHA,則展現了不錯的炒菜、收拾物品等能力。
但(dàn)是,人(rén)形機器(qì)人(rén)想要實現完全通(tōng)用化,這些(xiē)進展還(hái)遠遠不夠。無論是拿(ná)蘋果還(hái)是炒菜,體(tǐ)現的都是機器(qì)人(rén)的模仿學習能力,也就是通(tōng)過一遍遍模仿人(rén)類動作(zuò),學習單一技(jì)能。
“機器(qì)人(rén)跟物理(lǐ)世界交互的高(gāo)質量數(shù)據其實難獲得(de),所以模仿學習有(yǒu)其用武之地——通(tōng)過用人(rén)去教他,去積累一些(xiē)數(shù)。不過當下的模仿學習隻是單純地教機器(qì)人(rén)複制(zhì)人(rén)的動作(zuò),但(dàn)它并不能理(lǐ)解每一個(gè)動作(zuò)的驅動要素是什麽。或者說,機器(qì)人(rén)不明(míng)白為(wèi)什麽動作(zuò)要這麽做(zuò)。”顔黔杭表示,如果讓機器(qì)人(rén)完成“端杯水(shuǐ)然後加點糖”這類複雜的人(rén)類操作(zuò),模仿學習可(kě)能就無法實現。
“視(shì)覺傳感器(qì)的引入,可(kě)能讓機器(qì)人(rén)不再瞎了。但(dàn)還(hái)有(yǒu)更多(duō)其他維度的感知能力,今天的機器(qì)人(rén)都是欠缺的。”顔黔杭稱,比如觸覺、力覺的傳感器(qì)市面上(shàng)雖然有(yǒu),但(dàn)現在目前并沒有(yǒu)在機器(qì)人(rén)領域普及,主要原因是這些(xiē)傳感器(qì)集成度低(dī)、價格貴,體(tǐ)積相對與人(rén)形機器(qì)人(rén)來(lái)說也太大(dà)。
“強化學習就是不斷試錯的過程,相比于模仿學習有(yǒu)更強的泛化性。”
星動紀元聯合創始人(rén)席悅對钛媒體(tǐ)APP表示,類似于自動駕駛的訓練方式一樣,強化學習可(kě)以通(tōng)過構建仿真環境,讓機器(qì)人(rén)在真實場(chǎng)景的模拟環境中進行(xíng)訓練,在不斷地試錯中優化自己的行(xíng)為(wèi)。“強化學習訓練出來(lái)以後,機器(qì)人(rén)不僅能走樓梯,它也能走雪地,也能走草地,實現更好的泛化性。”
但(dàn)需要注意的是,仿真環境與真實世界無法做(zuò)到完全相同,現實世界的交互環境以及交互對象相比于仿真環境會(huì)更複雜。這就會(huì)導緻,仿真訓練結果遷移到真實世界會(huì)出現偏差,這也是目前整個(gè)行(xíng)業面臨的挑戰。
钛媒體(tǐ)APP曾*獲悉,星動紀元已經将Humanoid-Gym訓練框架進行(xíng)開(kāi)源。Humanoid-Gym開(kāi)源後,用戶可(kě)以借助該框架通(tōng)過sim-to-sim轉換接口,在更高(gāo)精度的仿真環境Mujoco中進行(xíng)機器(qì)人(rén)訓練驗證,繼而提升sim-to-real(仿真到現實)轉換的效率和(hé)成功率。
而除去大(dà)腦(nǎo)和(hé)小(xiǎo)腦(nǎo)的訓練之外,人(rén)形機器(qì)人(rén)能否走向通(tōng)用的最後一道(dào)門(mén)檻,則是本體(tǐ)是否可(kě)以完全承接軟件算(suàn)法傳遞的動作(zuò)指令。
“人(rén)形機器(qì)人(rén)的硬件技(jì)術(shù)産品主要圍繞傳感器(qì)、執行(xíng)器(qì)和(hé)驅動器(qì)、能源管理(lǐ)及新型材料等開(kāi)展工作(zuò)。”
IDC中國研究經理(lǐ)李君蘭對钛媒體(tǐ)APP表示,目前,盡管已有(yǒu)多(duō)種傳感器(qì)被應用于人(rén)形機器(qì)人(rén),但(dàn)在精度、響應速度和(hé)集成度方面仍有(yǒu)提升空(kōng)間(jiān)。同時(shí),人(rén)形機器(qì)人(rén)的能量消耗較大(dà),高(gāo)能效的能源動力管理(lǐ)和(hé)儲能技(jì)術(shù)也是一個(gè)重要挑戰。
“視(shì)覺傳感器(qì)的引入,可(kě)能讓機器(qì)人(rén)不再瞎了。但(dàn)還(hái)有(yǒu)更多(duō)其他維度的感知能力,今天的機器(qì)人(rén)都是欠缺的。”顔黔杭稱,比如觸覺、力覺的傳感器(qì)有(yǒu)很(hěn)多(duō),但(dàn)現在目前并沒有(yǒu)在機器(qì)人(rén)領域普及,主要原因是這些(xiē)傳感器(qì)集成度低(dī)、價格很(hěn)貴,體(tǐ)積相對與人(rén)形機器(qì)人(rén)來(lái)說也太大(dà)。
也正是因為(wèi)種種方面的掣肘,人(rén)形機器(qì)人(rén)的通(tōng)用之路變得(de)更加漫長。
3、更現實的當下,有(yǒu)可(kě)能的未來(lái)
當人(rén)形機器(qì)人(rén)的“通(tōng)用時(shí)刻”還(hái)未到來(lái)時(shí),如何活下去,成為(wèi)了創業公司最真實的現實處境。
“我們公司商業化上(shàng)的策略就是四個(gè)字——沿途下蛋。”
逐際動力方面稱,具身智能(包括人(rén)形機器(qì)人(rén)、四足機器(qì)人(rén)等多(duō)種産品形态)的應用場(chǎng)景非常廣泛,相比人(rén)形機器(qì)人(rén),四足機器(qì)人(rén)的商業化落地能力會(huì)更強。而後者,則是逐際動力需要下的蛋——依靠四足機器(qì)人(rén)成熟的移動能力,去實現産品商業化落地。
目前,逐際動力産品包括人(rén)形機器(qì)人(rén)CL1,雙點足機器(qì)人(rén)P1以及四(輪)足機器(qì)人(rén)W1。其中,雙點足機器(qì)人(rén)P1以及四(輪)足機器(qì)人(rén)W1落地應用聚焦在工業巡檢、物流配送、特種作(zuò)業等領域。
同樣的,成立更早的宇樹(shù)科技(jì)的主要營收也來(lái)自于四足機器(qì)人(rén)。這也是宇樹(shù)科技(jì)創立之初發力的業務方向,目前已經有(yǒu)Go2、B2、Aliengo等多(duō)個(gè)産品。公開(kāi)數(shù)據顯示,目前宇樹(shù)科技(jì)的四足機器(qì)人(rén)産品占全球出貨量的60%以上(shàng),處于全球曆年銷量*的位置。
星動紀元方面則表示,汽車(chē)和(hé)消費電(diàn)子的細分場(chǎng)景,比如,工廠巡檢、汽車(chē)總裝産線的物流部分,是公司目前探索的商業化方向。同時(shí),類似于商場(chǎng)迎賓等服務性質的工作(zuò),也存在商業化的可(kě)能。
“當然,對于人(rén)形機器(qì)人(rén)的創業公司而言,融資肯定是必須的。”星動紀元聯合創始人(rén)席悅對钛媒體(tǐ)APP表示,因為(wèi)人(rén)形機器(qì)人(rén)這個(gè)行(xíng)業還(hái)太早期,技(jì)術(shù)門(mén)檻更高(gāo)、研發周期相對來(lái)說也更長,早期肯定需要融資才能活下去。
事實上(shàng),人(rén)形機器(qì)人(rén)行(xíng)業出現的此刻,也是國內(nèi)自動駕駛行(xíng)業經曆的過去。
2017-2018年間(jiān),國內(nèi)開(kāi)始湧現大(dà)批的自動駕駛創業公司,并吸引了大(dà)量的風險投資機構進場(chǎng)。與人(rén)形機器(qì)人(rén)類似,自動駕駛領域也需要長周期的技(jì)術(shù)開(kāi)發,所以在早期對于投資機構的依賴度很(hěn)強。但(dàn)很(hěn)快,随着投資熱潮的褪去,自動駕駛公司的商業化能力開(kāi)始受到質疑。再之後,就是大(dà)批的自動駕駛團隊解散、裁員,甚至是對簿公堂。
“從技(jì)術(shù)門(mén)檻、創始團隊和(hé)行(xíng)業影(yǐng)響力等方面來(lái)看,人(rén)形機器(qì)人(rén)和(hé)自動駕駛的确非常像。但(dàn)是,這一輪人(rén)形機器(qì)人(rén)公司的估值普遍沒有(yǒu)上(shàng)一輪自動駕駛公司的估值高(gāo)。”
一位同時(shí)在自動駕駛和(hé)人(rén)形機器(qì)人(rén)領域工作(zuò)過的業內(nèi)人(rén)士表示,這是一件好事,大(dà)家(jiā)不用一味隻去追求公司估值,而忽略了商業化。“人(rén)形機器(qì)人(rén)這一波的創業者,部分已經看到了上(shàng)一波自動駕駛發展中的問題和(hé)風險,所以會(huì)對産品商業化的認知程度更高(gāo)。”
除此之外,該人(rén)士還(hái)表示自動駕駛的創業潮中,大(dà)家(jiā)習慣于單打獨鬥。
但(dàn)在人(rén)形機器(qì)人(rén)産業中,更強調的是合作(zuò)。比如,目前北京、上(shàng)海、深圳都由政府相關部門(mén)牽頭,成立了人(rén)形機器(qì)人(rén)的創新中心。由政府部門(mén)出面去拉通(tōng)産業鏈的上(shàng)下遊,有(yǒu)做(zuò)技(jì)術(shù)的,做(zuò)機器(qì)人(rén)關節的,做(zuò)商業化落地的。“大(dà)家(jiā)形成一個(gè)實體(tǐ),上(shàng)下遊公司均是股東單位,可(kě)以整個(gè)鏈條打通(tōng)。”
以北京為(wèi)例,4月27日,北京人(rén)形機器(qì)人(rén)創新中心在北京經開(kāi)區(qū)發布全球*純電(diàn)驅拟人(rén)奔跑的全尺寸人(rén)形機器(qì)人(rén)“天工”,能以6公裏/小(xiǎo)時(shí)的速度穩定奔跑。“天工”身高(gāo)163cm,輕量化體(tǐ)重達43kg,機器(qì)人(rén)配備多(duō)個(gè)視(shì)覺感知傳感器(qì),搭載了每秒(miǎo)550萬億次操作(zuò)算(suàn)力、高(gāo)精度的慣性測量單元(IMU)和(hé)3D視(shì)覺傳感器(qì)。
發布會(huì)上(shàng),創新中心總經理(lǐ)熊友(yǒu)軍表示,為(wèi)解決人(rén)形機器(qì)人(rén)行(xíng)業通(tōng)用問題,推動産業整體(tǐ)發展,北京人(rén)形機器(qì)人(rén)創新中心緻力于行(xíng)業關鍵共性核心技(jì)術(shù)研發,打造軟、硬兩個(gè)通(tōng)用母平台。目前,已成功研發出通(tōng)用人(rén)形機器(qì)人(rén)母平台“天工”。
北京經濟技(jì)術(shù)開(kāi)發區(qū)相關負責人(rén)介紹,作(zuò)為(wèi)北京市重要的機器(qì)人(rén)産業集聚地,北京亦莊目前彙集機器(qì)人(rén)生(shēng)态企業110家(jiā),形成覆蓋核心零部件、整機到應用的機器(qì)人(rén)全産業鏈體(tǐ)系。在人(rén)形機器(qì)人(rén)領域,不僅有(yǒu)小(xiǎo)米、優必選等人(rén)形機器(qì)人(rén)頭部企業落地發展,還(hái)有(yǒu)高(gāo)精密減速器(qì)、伺服系統等人(rén)形機器(qì)人(rén)零部件産品。
而在機器(qì)學習的軟件算(suàn)法層面,特斯拉FSD(完全自動駕駛)的成功,也讓人(rén)形機器(qì)人(rén)行(xíng)業看到了有(yǒu)可(kě)能的未來(lái)。
在特斯拉最新的FSD V12版本中,FSD Beta更名為(wèi)FSD (Supervised)。根據特斯拉官方的說法,在車(chē)主的監督下,最新版FSD Supervised幾乎可(kě)以在任何地方駕駛特斯拉。
在FSD V12之前,特斯拉的自動駕駛方案一直依賴于規則判斷,任何駕駛行(xíng)為(wèi)的背後都有(yǒu)代碼作(zuò)為(wèi)支撐,FSD V11 C++代碼多(duō)達30多(duō)萬行(xíng)。而在FSD V12版本版本中,依賴于手動編碼規則的方案被徹底抛棄,轉而全面采用端到端的神經網絡AI系統,代碼行(xíng)業縮減到隻有(yǒu)3000行(xíng)。
特斯拉FSD的端到端方案,本質上(shàng)是完全基于數(shù)據驅動。通(tōng)過将上(shàng)千萬個(gè)甚至上(shàng)億個(gè)人(rén)類駕駛視(shì)頻的高(gāo)質量數(shù)據,壓縮到了大(dà)模型中,特斯拉FSD就可(kě)以AI的方式去思考——遇到場(chǎng)景直接輸入傳感器(qì)數(shù)據,輸出轉向、制(zhì)動和(hé)加速信号,而且這個(gè)過程中沒有(yǒu)任何編碼。
據特斯拉2022年10月公布的信息顯示,Optimus人(rén)形機器(qì)人(rén)使用與特斯拉汽車(chē)相同的完全自動駕駛(FSD)電(diàn)腦(nǎo),以及Autopilot相關神經網絡技(jì)術(shù)。
這也就意味着,人(rén)形機器(qì)人(rén)完全可(kě)以利用FSD同樣的訓練方式,走向通(tōng)用之路。據王興興介紹,目前宇樹(shù)科技(jì)人(rén)形機器(qì)人(rén),從行(xíng)走奔跑到舞蹈空(kōng)翻等,已經完全采用類似端到端的解決方案,從視(shì)覺感知到腿部執行(xíng),一個(gè)模型就可(kě)以實現,沒有(yǒu)任何中間(jiān)過程和(hé)編碼。
“人(rén)形機器(qì)人(rén)硬件部分的成熟,隻是時(shí)間(jiān)問題。最重要的,還(hái)是通(tōng)用人(rén)形機器(qì)人(rén)的AI基礎大(dà)模型。”王興興稱,樂觀的估計(jì),基礎大(dà)模型的突破可(kě)能會(huì)在明(míng)年年底前發生(shēng)。但(dàn)是,也有(yǒu)可(kě)能不會(huì)發生(shēng)。“有(yǒu)時(shí)候技(jì)術(shù)的突破,需要看全球人(rén)類的運氣。就像當年如果沒有(yǒu)愛(ài)因斯坦,他的理(lǐ)論大(dà)概率也會(huì)有(yǒu)人(rén)發現,隻不過會(huì)晚個(gè)幾年到幾十年。”
【本文由微信公衆号:钛媒體(tǐ)發布,本平台僅提供信息存儲服務。】如有(yǒu)任何疑問,請(qǐng)聯系處理(lǐ)。