文|錦緞研究院 知勇
去年的一波熱潮過后,今年6月以來,人形機器人概念再度爆發(fā),多次集體漲停。
橫空出世的ChatGPT,不僅打破了沉寂許久的AI圈,也讓更多人開始期待AI與人形機器人結(jié)合產(chǎn)生的1+1>2的效果。
今年5月份特斯拉股東大會上,馬斯克對人形機器人提出雄心勃勃的目標,其推測人形機器人遠期需求將達100億臺,遠遠超過汽車需求。即使最終只達到預期的十分之一,產(chǎn)業(yè)空間也是一個極其誘人的數(shù)字。
而硬幣的另一面,“人形機器人只存在于科幻電影”、“人形機器人落地難”、“人形機器人只適合在工廠”等質(zhì)疑聲從未間斷。畢竟,在舉世矚目的2023世界人工智能大會上,特斯拉Optimus人形機器人并不能動,成了名副其實的鎮(zhèn)館展品。
很多人也開始懷疑自己是否在追逐白日夢,而這個白日夢是他們從《終結(jié)者》、《機器人管家》等科幻電影中激發(fā)出來的。
如果你是一個長期關注機器人領域的人,自然會有一個疑問,為什么人形機器人經(jīng)歷了數(shù)次風口還是不能落地,難道那些做人形機器人的公司都是為夢想窒息嗎,人形機器人的炒作何時休?
其本質(zhì)是,技術的發(fā)展不是線性的,雖然長期來看呈現(xiàn)波動向上的趨勢,但中間過程是起起落落,甚至是高開低走。
在最喧囂的時候,我們需要不斷打破線性預期。透過AI的發(fā)展歷史,或可更加冷靜看待人形機器人的成長軌跡。
01、從過去的AI看現(xiàn)在的人形機器人
1、AI是怎么發(fā)展到這一步的
“機器能思考嗎?”1950年,計算機先驅(qū)艾倫·圖靈在他的傳奇文章《計算機機械與智能》中提出了這個問題。
在1956年美國的達特茅斯會議上,約翰·麥卡錫等一眾世界頂尖科學家首次提出了“人工智能”一詞,標志著人工智能的正式誕生。
之后人工智能領域展現(xiàn)出一路高歌的趨勢,科學家們對人工智能做出了大量樂觀的暢想和預測,致力于盡快開發(fā)出能夠通過“圖靈測試”的人工智能。
可惜好景不長,在20世紀70至80年代,由于技術不足,然而許多人工智能程序更像是“玩具”,沒有實際應用前景。人工智能的發(fā)展第一次陷入沉寂。
在這之后的數(shù)十年,科學家們一直沒有停止追求真正的人工智能。但事實上,所謂的人工智能卻常常被調(diào)侃為“偽智能”,只能按照程序設定執(zhí)行特定指令。
直到2016年,也就是人工智能誕生60年后,谷歌的AlphaGO擊敗圍棋世界冠軍李世石。AlphaGO用4比1的戰(zhàn)績告訴世人思考和創(chuàng)造力不再是人類獨有的技能。
一朝成名天下知,AlphaGO的勝利給人們帶來了無限遐想,“人工智能”這個概念的熱度一下子達到了前所未有的高度。
AlphaGo的突破在于:它可以自行深度學習進行走棋和預測,不需要人來設計算法“找特征”。表面上看AlphaGo比世界冠軍更會下棋,背后是其不再使用蠻力算法,而是通過算法層面的創(chuàng)新及大規(guī)模深度學習訓練后的人工神經(jīng)網(wǎng)絡,從錯誤中不斷學習,最終展現(xiàn)出超人水準。
這場人機大戰(zhàn)在當時無疑是人工智能發(fā)展史上的一個高峰,市場頗為一致地相信人工智能產(chǎn)業(yè)奇點將近,或?qū)⒋呋乱惠啴a(chǎn)業(yè)革命。IBM等科技巨擘均重金投資人工智能。
在國內(nèi),人工智能同樣掀起了一輪技術創(chuàng)新的浪潮。國內(nèi)商湯科技、云從科技、格靈深瞳等眾多人工智能初創(chuàng)公司受到投資界的普遍追捧。一切都預示著:人工智能的時代已經(jīng)到來。
然而,在高點過后,被寄予遠大前景的人工智能并沒有大范圍成功,相反,卻很快失去了光環(huán),迎來“人工智能的寒冬”。伴隨著人工智能再次沉寂,市場一度出現(xiàn)了AI泡沫破滅的悲觀論調(diào)。
直到ChatGPT上線,AI再次從低谷沖上高峰。似乎一夜之間,AI進化成超級聰明的聊天伙伴,變成了能夠完成個性化任務的辦公助手。就像當年的AlphaGO一樣,ChatGPT再次改變?nèi)祟悓I的認知。
如今,圖靈等計算機先驅(qū)們在二戰(zhàn)后就夢想的AI技術正在一步步走向現(xiàn)實:AI能夠識別圖片和人,能夠回答復雜的邏輯性問題,能夠自己編寫創(chuàng)造性的文本,甚至創(chuàng)造曲譜等。
從全球商業(yè)化應用上看,AI在金融、教育、醫(yī)療、安防、自動駕駛等領域已經(jīng)星火燎原。
2、相比AI,今天人形機器人走到哪一步了?
2021年8月,馬斯克在特斯拉AI日上發(fā)布人形機器人的概念圖,將人形機器人再一次帶入了大眾視線。同時期,亞馬遜、三星、谷歌等科技巨頭紛紛加大對人形機器人領域的投入力度,使得機器人賽道熱度驟然升溫。
時隔一年,2022年10月,馬斯克帶來特斯拉人形機器人,站在馬斯克旁邊的特斯拉Optimus,成為科技界的新寵。
今年7月的2023世界人工智能大會上,特斯拉Optimus變身“流量明星”引來大量人群圍觀,拍照、合影、直播。
特斯拉Optimus身高172cm,體重56.6kg,就是一個正常成年人的身形。其全身擁有28個自由度,手部有11個自由度,就如同人體的關節(jié),可以實現(xiàn)靈活地抓握,且力大無比,可以單手舉起一臺鋼琴。
對人機器人而言,特斯拉Optimus的出現(xiàn)更像是當年的AlphaGo面世,正給世人描繪更大的應用前景。
因為馬斯克的號召力,市場對人形機器人的看多情緒被徹底引爆。畢竟馬斯克把很多不可能的事情做成了,大家都愿意跟隨他。也因為馬斯克,正在讓更多人深入地研究人形機器人。
02、人形機器人將再次沉寂,然后再次爆發(fā)
事實上,特斯拉目前沒有成熟的執(zhí)行器供應商可以用于Optimus,而是需要自己定制,執(zhí)行器作為人形機器人的核心部件,集成了電機、控制器、傳感器等,每一種器件都是單獨定制的,設計并不容易。
正如一句老話所說:“對于人類來說很難的事情,對機器來說很簡單?!狈粗嗳?。
以抓取場景為例,對于人來說,抓取觸碰是一件再普通不過的事,但對機器的驅(qū)動系統(tǒng)就提出了很大挑戰(zhàn),一個機械關節(jié)想要觸碰雞蛋而不碎,背后需要非常精準的電機扭矩控制,而且中間需要大量軟硬件結(jié)合的調(diào)試和學習。
目前,特斯拉僅制造了10臺Optimus人形機器人,所以拿個模型放在人工智能大會上也不足為奇了。
根據(jù)公司在二季度業(yè)績電話會上的透露細節(jié),特斯拉Optimus人形機器人將在11月左右進行更多的行走和任務執(zhí)行測試,在明年某個時候,將從特斯拉工廠開始嘗試,讓Optimus投入真正的生產(chǎn)活動中。在讓人形機器人變得更聰明以前,特斯拉要先考慮的是如何讓人形機器人在工廠工作時變得更熟練。
換句話說,Optimus人形機器人在工廠的應用還處在試驗階段,其他應用場景也只能排在更加后面。短期來看,這顯然要讓把養(yǎng)老的希望寄托在人形機器人身上的人群失望了。
特斯拉將Optimus定位為一款功能強大的機器人,可以執(zhí)行不同任務的能力,在生產(chǎn)和生活中都可以扮演非常重要的角色,未來在全球各地幫助數(shù)以百萬計的人。
但是馬斯克能否復制特斯拉電動車的成功,依然要打上一個問號,而它最大的挑戰(zhàn)是如何用極致的成本實現(xiàn)足夠發(fā)性能。畢竟馬斯克也不止一次跳票了。
比如電動皮卡Cybertruck,雖然馬斯克稱其是特斯拉的一張王牌,但這款車因電池供應等問題多次被推遲交付,從2021年底推遲到2022年底,再又推遲到2023年中期。直到今年的股東大會上,馬斯克終于承諾將在年內(nèi)交付。所以,如果馬斯克這兒的商業(yè)化不及預期,人形機器人很有可能會再次掉入起落曲線中的又一個低谷,沉寂在所難免。
類似的,AI未來可能一樣還會再次遇到沉寂期。以ChatGPT為例,未來會遇到一些瓶頸,而這個瓶頸之一就是數(shù)據(jù)要素。一旦人類產(chǎn)生的數(shù)據(jù)被ChatGPT挖掘的差不多了,沒有新的數(shù)據(jù)投喂,ChatGPT如何迭代升級?
不管是人工智能還是人形機器人都曾經(jīng)歷了多個周期,歷過低谷和高峰,在起起落落中向上發(fā)展。然后,人們對它的期望越大,失望越大。
人形機器人上一次的高點是2016年前后,當時國內(nèi)涌入了一大批新玩家,面對又一個新的技術浪潮,萬眾期待。但事后證明,當時的人形機器人更像是大號玩具,當初想象的情景并未在各行各業(yè)廣泛落地。最后活下來的所謂人形機器人公司也是寥寥無幾。不過,人形機器人還會再次突破,未來達到一個新的高點。
從性能角度,還是以特斯拉為例,在他們看來,人形機器人等于沒有輪子的自動駕駛汽車。特斯拉電動車的自動駕駛能系統(tǒng)和視覺神經(jīng)網(wǎng)絡系統(tǒng)在Dojo超級計算機的加持下,可以利用動作捕捉來“學習”人類,讓人形機器人的性能變強大。
從成本角度,目前市場的人形機器人動輒百萬元,而且性能還達不到人們的預期。但是如果成本降到50萬,甚至20萬區(qū)間呢,這就相當于一輛中高端電動車的售價,如果性能達到一定程度,意味著大量普及的可能性。
比如在工廠中,用工業(yè)機器人加AGV,以及自動化的設備,替代大量人工,降低制造成本。但是工業(yè)機器人還無法代替精細活的關鍵崗位。假如人形機器人能夠勝任,人形機器人大軍將會越來越龐大。
更樂觀一點,未來特斯拉人形機器人真如以低于2萬美元的價格銷售。那么能夠打掃地板和清潔窗戶的人形機器人會讓我們的生活更輕松,就像家里的洗衣機和洗碗機一樣。
當年特斯拉最開始的一款純電車型總銷量還不到現(xiàn)在一個月的銷售,如今Model 3已經(jīng)成了街車。背后是成本下降和性能提升的疊加效果。
值得一提的是,ChatGPT的出現(xiàn)為人形機器人提供了新思路——將大語言模型與人形機器人結(jié)合,通過圖像、文字、視頻等數(shù)據(jù)聯(lián)合訓練,并引入多模態(tài)輸入,增強模型對現(xiàn)實中對象的理解,幫助人形機器人處理具身推理任務。濃縮成一句話就是以AI為人形機器人注入靈魂。如果從長遠來看,投資回報率才是影響全球?qū)C器人態(tài)度的關鍵。
以亞馬孫的無人超市為例。當亞馬遜在市中心設立無人售貨的小商店時,相機、傳感器和射頻識別芯片組成的系統(tǒng)會自動計算購物車里商品的總價。雖然亞馬遜需要在自動化貨架和收銀系統(tǒng)上額外投資數(shù)百萬美元,但在人工成本上節(jié)省了,于是它在之后的某個階段就可以收回成本。
類似的,如果一家養(yǎng)老院的職工能用人形機器人替代,那么這時人形機器人所帶來的回報就不是以美元計算了,這時候的衡量標準變成了社會效率的提升。
總之,一旦人形機器人的性能和價格符合預期,將觸發(fā)新技術進入正反饋閉環(huán)循環(huán)。那時人形機器人的發(fā)展就勢不可擋了。
03、為什么還要強調(diào)持續(xù)關注?
未來人形機器人還會再次沉寂,也會再次起來,離商業(yè)化漸行漸近。那為什么我們要持續(xù)保持關注呢?不同點在于,本輪人形機器人浪潮,中國隊不再是旁觀者而是深度參與者,甚至有望成為引領者。
過去十多年來,蘋果鏈、電動車產(chǎn)業(yè)鏈、家電產(chǎn)業(yè)鏈的成熟,催生了一大批標準化、規(guī)模化的零部件公司。歷經(jīng)產(chǎn)業(yè)洗禮的他們具備一定的規(guī)?;a(chǎn)和定制化開發(fā)能力。同樣地,我國機器人產(chǎn)業(yè)鏈完整框架已初具雛形。比如三花、拓普、雙環(huán)、恒立、匯川、綠的、埃斯頓等,有機會更快切入人形機器人的供應鏈。
依托中國成熟的供應鏈,在看到特斯拉大規(guī)模量產(chǎn)前,我們會看到各種國產(chǎn)的人形機器人。比如達闥雙足機器人、傅里葉機器人。中國企業(yè)不再是處在微笑曲線的底部。就像和AI賽道一樣,不再只有谷歌等硅谷大公司,而有百度、阿里、科大訊飛等科技大廠。
未來機器人很有可能會成為科技博弈的一個焦點,以中美兩國主導的人形機器人“競賽”已經(jīng)拉開序幕。如今的市場上不斷涌現(xiàn)出人形機器人技術的突破,并且更多的突破正在醞釀中。