文|智東西 程茜
編輯|心緣
智東西10月1日?qǐng)?bào)道,北京時(shí)間9點(diǎn)19分,一個(gè)全身裸露電線的人形機(jī)器人緩緩走上特斯拉AI Day 2022的舞臺(tái),向現(xiàn)場觀眾揮手打招呼。
去年8月,特斯拉CEO馬斯克在第一屆特斯拉AI Day上重磅公布特斯拉首款人形機(jī)器人“擎天柱”(Optimus)的概念圖。今年,為了讓人形機(jī)器人順利發(fā)布,馬斯克將“特斯拉AI Day”從原定的8月19日推遲了40多天!
今天,“擎天柱”終于從一個(gè)身著白衣、頭戴黑面紗的真人扮演者變成了真的機(jī)器人,馬斯克的“造人夢”照進(jìn)了現(xiàn)實(shí)。
“我們的目標(biāo)是盡快制造出有用的仿人機(jī)器人?!瘪R斯克說,擎天柱將是一種“能力極強(qiáng)的機(jī)器人”,產(chǎn)量非常高,最終將生產(chǎn)數(shù)百萬臺(tái),并且預(yù)計(jì)成本將遠(yuǎn)低于汽車——不到2萬美元。
按其說法,擎天柱最初會(huì)從事一些枯燥或危險(xiǎn)的工作,比如在特斯拉工廠周圍移動(dòng)部件,或用扳手給汽車安裝螺栓。按照馬斯克的設(shè)想,未來機(jī)器人還可以用于家庭、做飯、修剪草坪和照顧老人,乃至成為人類的“伙伴”或伴侶。
同時(shí)馬斯克談道,要完善并證明擎天柱,還有很多工作要做。
他還在活動(dòng)期間發(fā)推文,透露擎天柱機(jī)器人將會(huì)有“貓女版”。
01 能澆水、送物、流水線工作6個(gè)月推出原型機(jī)
完全體的特斯拉人形機(jī)器人“擎天柱”體重73kg,用電功率在靜坐時(shí)為100W,快走時(shí)500W,全身有200多個(gè)自由度,手部27個(gè)自由度。馬斯克稱,一個(gè)人形機(jī)器人的成本大概在2萬美元之內(nèi),遠(yuǎn)低于一輛汽車。
在現(xiàn)場,馬斯克展示了工程版“擎天柱”,全身裸露天線的“擎天柱”初始版走下臺(tái)后,一段視頻中展示了人形機(jī)器人的才藝。
在特斯拉工廠內(nèi),“擎天柱”可以搬起印有特斯拉標(biāo)志的箱子,并將其運(yùn)送到其他地方。
“擎天柱”能夠拿起放在桌子上的水壺,然后行走至辦公室內(nèi)的花草種植區(qū),為花草澆水。其中,渲染的圖片就是機(jī)器人的“視角”,看起來除了色彩差異與人類正??吹降膱D像內(nèi)容沒有特別大的區(qū)別。
在工廠里,機(jī)器人能將一個(gè)長條狀的物體從工作臺(tái)拿下來,再整齊排放至裝有相同物體的盒子中。在機(jī)器人視角的渲染圖中,它能夠用顏色區(qū)分開現(xiàn)實(shí)世界中的不同物體。如它手持的長條形物體是紫色、工作臺(tái)是黃色等。
隨后,一臺(tái)更像人的“擎天柱”被推上現(xiàn)場,它同樣可以張開雙手或抬起右手,向臺(tái)下緩慢打招呼。
真機(jī)版本的“擎天柱”因?yàn)槟_下有支撐裝置,還可以同時(shí)抬起雙手雙腳。
不過,與初始版本不同的是,優(yōu)化版“擎天柱”并沒有在現(xiàn)場走動(dòng),而是全程由工作人員搬運(yùn)。
在過去的四個(gè)月里,特斯拉的人形機(jī)器人就一直在辦公室內(nèi)四處走動(dòng)。
現(xiàn)階段,特斯拉人形機(jī)器人項(xiàng)目從去年2021年AI Day上的概念圖,到今年2月,短短六個(gè)月就推出了原型機(jī),現(xiàn)在已經(jīng)有近似完全體的新一代“擎天柱”亮相。
特斯拉第一代機(jī)器人從概念、設(shè)計(jì)、分析、建立、優(yōu)化、驗(yàn)證經(jīng)過了反復(fù)驗(yàn)證,對(duì)于這一新物種來說,擁有較低的成本和較高的工作效率也正是驗(yàn)證這一產(chǎn)品是否能真正推向市場的關(guān)鍵。
02 以汽車設(shè)計(jì)過程為基礎(chǔ)優(yōu)化調(diào)參至機(jī)器人平臺(tái)
擎天柱的設(shè)計(jì)是以特斯拉此前積累的車輛設(shè)計(jì)過程為基礎(chǔ)。
人類可以吃少量的食物來維持能量,因此為了減少機(jī)器人上消耗的能力,特斯拉將人形機(jī)器人在空閑時(shí)消耗的能量降到最低,只需要按下開關(guān)就可以調(diào)節(jié)其處于低電量或者正常工作的狀態(tài)。
1、電動(dòng)和控制系統(tǒng):28個(gè)驅(qū)動(dòng)器+2.3kWh的電池組,可工作一整天
從其概念圖中可以看到,整個(gè)機(jī)器人包含了28個(gè)電動(dòng)驅(qū)動(dòng)器(橙色)和電池及控制模塊(藍(lán)色)。
“擎天柱”身體中間有2.3kWh的電池組,工作電壓為52V,能支持人形機(jī)器人工作一整天。這個(gè)電池組的獨(dú)特之處在于,它把所有的電池電子都集成到了一起,傳感器融合電荷管理等,利用汽車和機(jī)能源產(chǎn)品將其融合到一起。這也是特斯拉流線型制造的高效之處。
除技術(shù)外,當(dāng)然也離不開特斯拉強(qiáng)大的基礎(chǔ)設(shè)施和供應(yīng)鏈。
特斯拉機(jī)器人使用了單顆特斯拉自研SoC芯片,不同于特斯拉在汽車上使用的雙芯片自動(dòng)駕駛方案。
與汽車不同,機(jī)器人需要處理視覺數(shù)據(jù)做出迅速反應(yīng)、基于多種感官輸入和通訊,因此裝有無線電連接、音頻支持以及需要保護(hù)機(jī)器人本體和人類的安全特性。
2、基礎(chǔ)結(jié)構(gòu)設(shè)計(jì):量化人體運(yùn)動(dòng)軌跡、力度,機(jī)器人行動(dòng)更靈活
特斯拉有能力完成高度復(fù)雜的系統(tǒng)。如人們?cè)隈{駛時(shí)遇到的突然撞擊,汽車做出相應(yīng)反應(yīng)的過程。因此,為了保護(hù)機(jī)器人,研發(fā)人員對(duì)其結(jié)構(gòu)基礎(chǔ)進(jìn)行了優(yōu)化,在人形機(jī)器人摔倒時(shí)不會(huì)把變速器和胳膊弄壞,就可以將這一技術(shù)應(yīng)用到機(jī)器人之上。畢竟一臺(tái)機(jī)器人的維修成本很高。
研發(fā)人員采用了與汽車相同的底層技術(shù),讓機(jī)器人在所有組件中產(chǎn)生壓力,使得其行走控制變得更加容易,也不會(huì)那么僵硬。
以膝蓋為例,人形機(jī)器人在設(shè)計(jì)時(shí)需要仿照人類真實(shí)的膝蓋結(jié)構(gòu)。
研發(fā)人員將人類的膝蓋和其運(yùn)動(dòng)過程中所受的力線性化,從而學(xué)習(xí)如何讓機(jī)器人膝蓋使用更少的力來構(gòu)建,讓其能實(shí)現(xiàn)更好的力度控制,并讓相關(guān)結(jié)構(gòu)緊密的包裹在膝蓋周圍。
3、機(jī)械驅(qū)動(dòng)系統(tǒng):解析云端數(shù)據(jù),輕松定制28個(gè)驅(qū)動(dòng)器
汽車和機(jī)器人在動(dòng)力設(shè)計(jì)上有很多相似之處,因此,特斯拉在動(dòng)力設(shè)計(jì)上的經(jīng)驗(yàn)可以應(yīng)用到機(jī)器人上。
汽車的驅(qū)動(dòng)單元是為了讓汽車加速,機(jī)器人有28個(gè)關(guān)節(jié)驅(qū)動(dòng)器,和汽車的驅(qū)動(dòng)器在數(shù)量上相比差異并不明顯,但人形機(jī)器人要做的任務(wù)則更為復(fù)雜,它們需要走路或者攀巖,因此研發(fā)人員用模型生成機(jī)器人的連接轉(zhuǎn)矩速度軌跡,隨后輸入其優(yōu)化模型來運(yùn)行。
機(jī)器人需要轉(zhuǎn)動(dòng),研發(fā)人員根據(jù)扭矩速度軌跡和關(guān)節(jié)驅(qū)動(dòng)器的效率圖,沿著軌道產(chǎn)生的能源消耗、任務(wù)與時(shí)間的累計(jì)能量,就可以定義特定執(zhí)行機(jī)構(gòu)的樣本,并發(fā)送到云端。這樣一來,就可以縮短其生產(chǎn)成百上千萬關(guān)節(jié)驅(qū)動(dòng)器的時(shí)間。
不過,機(jī)器人的每個(gè)關(guān)節(jié)都是特定的,28個(gè)關(guān)節(jié)都需要定制規(guī)格。因此,研發(fā)人員需要減少定制的執(zhí)行器設(shè)計(jì),解析它們上傳的云并采取共性研究。
“擎天柱”的關(guān)節(jié)驅(qū)動(dòng)器共有6種,包括三種不同規(guī)格的舵機(jī)、三種不同規(guī)格類似重量秤一樣的牽引執(zhí)行器等。
在極限范圍內(nèi)進(jìn)行測試,其關(guān)節(jié)驅(qū)動(dòng)器抬起一架半噸重的鋼琴,這也是人形機(jī)器人必須具備的功能。
4、手部感知系統(tǒng):大、小形態(tài)均能抓握,手部也能感知物體
人手能以每秒300度的速度移動(dòng),擁有成千上萬的觸覺傳感器。特斯拉機(jī)械手的設(shè)計(jì)靈感就來自于生物學(xué),和人手一樣同樣使用五個(gè)手指來驅(qū)動(dòng),既可以完成大口徑物體抓取,同時(shí)也能滿足抓取精巧物體的需求。
我們周圍世界的工廠被設(shè)計(jì)為適于人手抓握的,但也會(huì)出現(xiàn)很多我們沒見過的物體。因此,特斯拉的人形機(jī)器人手指有6個(gè)執(zhí)行器和11個(gè)自由度,搭載了能夠驅(qū)動(dòng)手指并進(jìn)行感知的傳感器。
手的適應(yīng)機(jī)制是非常復(fù)雜的,人類可以認(rèn)識(shí)到手在空間中的位置,而這也是其能抓取物體的關(guān)鍵。因此,特斯拉目前也在進(jìn)行相應(yīng)測試。
5、視覺導(dǎo)航系統(tǒng):采用汽車同款神經(jīng)網(wǎng)絡(luò),自主識(shí)別行駛區(qū)域
在機(jī)器人的行動(dòng)方面,“擎天柱”使用特斯拉電動(dòng)車同樣的神經(jīng)網(wǎng)絡(luò)——“占用網(wǎng)絡(luò)”來識(shí)別可行駛區(qū)域,研究人員稱,他們正在研發(fā)如何改善“占用網(wǎng)絡(luò)”,來使得機(jī)器人更快、更精準(zhǔn)到達(dá)目的地。他們最近在訓(xùn)練人形機(jī)器人的計(jì)算機(jī)視覺識(shí)別高頻特征,讓人形機(jī)器人能夠快速找到最近的充電站。
研發(fā)人員在模擬測試中,使用自動(dòng)駕駛模擬器并集成了機(jī)器人的運(yùn)動(dòng)代碼,在今年四月份,“擎天柱”的移動(dòng)速度很慢。
研發(fā)人員演示了擎天柱機(jī)器人的行動(dòng)成長軌跡。從2022年4月份邁出第一步,到2022年7月,讓人形機(jī)器人解鎖了骨盆的應(yīng)用來保持平衡,2022年8月,讓手臂開始發(fā)揮作用,直到2022年9月,擎天柱的腳趾也派上了用場,可以看出,隨著人形機(jī)器人慢慢將更多的關(guān)節(jié)等利用起來并加以訓(xùn)練,它的移動(dòng)速度有了明顯提升。
6、行動(dòng)控制系統(tǒng):優(yōu)化調(diào)參從測試映射至現(xiàn)實(shí),解決機(jī)器人平衡難題
從人體步行的過程來看,機(jī)器人有身體上的自我意識(shí)很重要,如能意識(shí)到自己四肢的長度是多少、腳有多大,并且如何保持平衡,如何協(xié)調(diào)四肢運(yùn)動(dòng)。人類很容易就能做到這些,但對(duì)于機(jī)器人來說很難。
研發(fā)人員通過運(yùn)動(dòng)計(jì)劃和控制堆棧,生成機(jī)器人運(yùn)動(dòng)學(xué)模型,然后將所需路徑生成底層平臺(tái),讓整個(gè)系統(tǒng)參考其軌跡進(jìn)行訓(xùn)練。
機(jī)器人模擬系統(tǒng)中按照其期望的路徑規(guī)劃一條線路,不斷添加相互連接的軌跡,然后根據(jù)軌跡規(guī)劃出每個(gè)腳的落腳點(diǎn),然后再讓執(zhí)行器執(zhí)行,以此保證機(jī)器人行走過程中的平衡性。
在運(yùn)動(dòng)訓(xùn)練中,運(yùn)動(dòng)規(guī)劃式是一個(gè)理想情形,但實(shí)際上將其放到現(xiàn)實(shí)世界上是不現(xiàn)實(shí)的。在這個(gè)過程中缺少幾個(gè)關(guān)鍵動(dòng)作,將其放置到現(xiàn)實(shí)世界中,會(huì)對(duì)模型動(dòng)力學(xué)造成影響,特別是像兩足動(dòng)力學(xué)這樣穩(wěn)定的系統(tǒng)。
研發(fā)人員利用相應(yīng)的傳感器以及他們?cè)诂F(xiàn)實(shí)世界中的觀察來解決機(jī)器人的控制難題,機(jī)器人的骨盆位置、重心位置,使用更好的機(jī)器人模型來進(jìn)行訓(xùn)練。
通過跟蹤機(jī)器人在工作室中的路徑來構(gòu)建更好的機(jī)器人模型,并依據(jù)實(shí)際情況修正機(jī)器人的行為。
7、手部控制系統(tǒng):人類模擬視頻映射運(yùn)動(dòng)參考,掌握抓握物體位置
為了解決人形機(jī)器人在觀察的同時(shí)操縱真實(shí)的物體世界的難題,研發(fā)人員將這一步驟分成了兩個(gè),首先生成一個(gè)自然運(yùn)動(dòng)參考系統(tǒng),然后再將其進(jìn)行優(yōu)化推廣。
假設(shè)有一個(gè)人類對(duì)某一動(dòng)作進(jìn)行了演示,然后研發(fā)人員通過視頻對(duì)其動(dòng)作設(shè)置關(guān)鍵幀,并將其映射到機(jī)器人上。這樣只需要一個(gè)演示視頻,研發(fā)人員就可以將其推廣到機(jī)器人的現(xiàn)實(shí)操縱應(yīng)用上。
這就可以解決機(jī)器人在抓取物體時(shí)手應(yīng)該放在哪里,如何進(jìn)行搬運(yùn)放置等難題。
03 人形機(jī)器人進(jìn)階路仍有無限可能
人形機(jī)器人這一新物種自誕生起就引發(fā)了熱烈討論,今年已經(jīng)有多家知名科技公司發(fā)布了人形機(jī)器人,前有小米“鐵大”,現(xiàn)在特斯拉“擎天柱”在概念版亮相一年后,終于公布了可以走起來的工程版,同時(shí)在這次AI Day上,公布了十分完整的技術(shù)路線。
人形機(jī)器人因其技術(shù)集成度及難度都很高,被視作AI領(lǐng)域的終極形態(tài),也將成為未來智能機(jī)器人的重點(diǎn)發(fā)展方向之一。
現(xiàn)如今,服務(wù)、工業(yè)、特種機(jī)器人已經(jīng)深入到社會(huì)生活的方方面面,小至家庭中的掃地機(jī)器人,大到工廠配送、機(jī)械臂等。而人形機(jī)器人仍然是一個(gè)新鮮事物。
從其技術(shù)難度而言,人形機(jī)器人不同于其他機(jī)器人形態(tài),代表了人們腦海中機(jī)器人的理想形態(tài),其研發(fā)難度也可想而知。
特斯拉作為第一家將其擺上臺(tái)面并在控制、步行方面都較為穩(wěn)定的企業(yè),離不開這家公司在自動(dòng)駕駛領(lǐng)域的多年技術(shù)積累。事實(shí)上,自動(dòng)駕駛技術(shù)中的神經(jīng)網(wǎng)絡(luò)架構(gòu)、AI算法、激光雷達(dá)等都可以遷移至人形機(jī)器人研究中。
馬斯克在第一屆“AI Day”上曾說過:“我們的汽車是帶輪子的半感知機(jī)器人——用神經(jīng)網(wǎng)絡(luò)識(shí)別世界,了解如何在世界中導(dǎo)航?!?/p>
再加上隨著AI技術(shù)不斷進(jìn)步,伴隨著人機(jī)交互能力加強(qiáng),其具備的人形相比于其他機(jī)器人形態(tài)來說,能夠更好的滿足情感和陪伴需求,這也為人形機(jī)器人的發(fā)展帶來了更多可能性。
談及馬斯克研發(fā)人形機(jī)器人的初衷,要追溯到四年前。馬斯克認(rèn)為特斯拉的工廠“過度依賴機(jī)器人”,并且在很多任務(wù)上,機(jī)器人的表現(xiàn)并不如人類。因此,“擎天柱”的初始應(yīng)用場景也被他放到了代替人們從事枯燥、危險(xiǎn)性的工作上。
04 結(jié)語:馬斯克讓人形機(jī)器人商業(yè)化之路可期
等了一年之久的“擎天柱”,終于出現(xiàn)在了大眾視野中,這也成為特斯拉“AI Day”最受矚目的環(huán)境。不過,其新奇的外觀與性能并不是關(guān)鍵,對(duì)于人形機(jī)器人而言,其真正量產(chǎn)落地才是衡量這一新物種是否真正有價(jià)值的關(guān)鍵。
但從其能澆花、搬東西這些更為細(xì)致的功能來看,馬斯克仍一直堅(jiān)持著向擬人形態(tài)機(jī)器人不斷進(jìn)階,從手部動(dòng)作、步態(tài)調(diào)整、控制系統(tǒng)等,依托于特斯拉在汽車領(lǐng)域的強(qiáng)大技術(shù)積累,和基礎(chǔ)設(shè)施及供應(yīng)鏈。再加上馬斯克在人形機(jī)器人領(lǐng)域的野心和他強(qiáng)大的行動(dòng)力,為這一產(chǎn)業(yè)帶來了無限憧憬。
馬斯克在人形機(jī)器人亮相后說:“自動(dòng)駕駛汽車對(duì)世界產(chǎn)生的巨大影響,使得運(yùn)輸生產(chǎn)力提升上至少提高了半個(gè)數(shù)量級(jí),未來,擎天柱或許會(huì)帶了數(shù)個(gè)數(shù)量級(jí)的提升?!?/p>
此前曾有爆料稱特斯拉“擎天柱”預(yù)計(jì)2023年實(shí)現(xiàn)量產(chǎn),計(jì)劃在德州工廠部署數(shù)千臺(tái)人形機(jī)器人,最終可能會(huì)擴(kuò)展到全球數(shù)百萬臺(tái)。如果特斯拉的人形機(jī)器人能最終量產(chǎn),并真正解決其落地難題,有望促進(jìn)人形機(jī)器人的產(chǎn)業(yè)發(fā)展向前邁進(jìn)一大步。