×

掃碼關(guān)注微信公眾號

硬核!“華為天才少年”讓自己組裝一臺家用機器人不是夢(mèng)!

2025/3/12 19:45:41      挖貝網(wǎng) 周路遙

如果說(shuō)宇樹(shù)機器人向我們展示了新一代機器人在工業(yè)、娛樂(lè )等方面的潛力,那么由“華為天才少年” 彭志輝創(chuàng )立的智元機器人則在昨天開(kāi)啟了機器人在家用領(lǐng)域的應用大門(mén)。

6.png

沒(méi)有跳舞、武術(shù)、翻越障礙等花哨的動(dòng)作,智元機器人靈犀X2展示的僅僅只是騎車(chē)、縫葡萄、看書(shū)、聊天等我們日常生活中普通的情形,但是我們知道,這些普通的情形,才是機器人產(chǎn)業(yè)大的難點(diǎn)——在電力的驅動(dòng)下,想要化身大力士不難,只要一個(gè)千斤頂即可,但要模仿人類(lèi)的日常動(dòng)作,卻涉及人工智能、機械、電子、影像等方方面面的技術(shù)。

在擁有這些人類(lèi)的基礎能力后,讓靈犀X2g更像一個(gè)人了!所以彭志輝表示:“我們希望機器人的生產(chǎn)力價(jià)值能夠外溢到日常生活,讓機器人成為‘吉祥三寶’,也就是保安、保姆和保潔?!?/p>

那么,智元機器人如何做到讓旗下產(chǎn)品初具家用機器人的雛形呢?

硬件為基:可以像組裝電腦一樣組裝機器人

總體來(lái)看,智元機器人靈犀X2全身共28個(gè)自由度、體重33.8千克,采用了一套基于Diffusion的生成式動(dòng)作引擎,基于VLM的硅光動(dòng)語(yǔ)多模態(tài)模型。其中,在硬件方面,靈犀X2共有三大創(chuàng )新!

像組裝電腦一樣組裝機器人:

7.png

靈犀 X2在硬件設計中,將靈犀 X2硬件系統抽象為一系列可復用的核心組件,核心組件包括:小腦控制控制器 Xyber-Edge,域控制器 Xyber-DCU,智能電源管理系統 Xyber-MS 以及迭代了多版本的核心關(guān)節模組 Powerflow 等等。

通過(guò)這些可拆分、復用組件,智元能夠像組裝臺式電腦一樣,快速搭建起一套靈活、完整、可靠的人形機器人系統。

大量使用柔性材料:

在機體的材料選擇上,智元使用了非常親和的柔性材料。這使得靈犀 X2 的皮膚柔軟有彈性,這一方面能夠保證運動(dòng)時(shí)的柔韌性,另一方面也對人類(lèi)接觸友善。

全新的關(guān)節設計:

靈犀 X2 的機電關(guān)節模組重新設計,在 X2 原型機全身 28 個(gè)自由度中,沒(méi)有使用到任何一個(gè)并聯(lián)結構,既能夠保證慣量上移,又實(shí)現了傳動(dòng)鏈的完全解構。這意味著(zhù)任一關(guān)節的活動(dòng),都是獨立驅動(dòng),避免并聯(lián)結構中多鏈條驅動(dòng)帶來(lái)的相互約束問(wèn)題,降低了肢體末端的慣性,保證動(dòng)作更靈敏精確。

軟件為“心”:讓機器人自身具有學(xué)習和交流能力

要讓一臺機器人像人,只有硬件創(chuàng )新是不夠的,這只能讓它在外形上像人。還必須搭配算法和大模型技術(shù),才能夠讓機器人在行為動(dòng)作上,也像一個(gè)人!

相比于傳統的機器人,人類(lèi)大的特點(diǎn)是具有自主學(xué)習能力,而靈犀X2在這方面邁出了關(guān)鍵一步,該機器人同樣具有自主學(xué)習能力。

8.png

3月10日,智元機器人還發(fā)布了首個(gè)通用具身基座模型——智元啟元大模型,它開(kāi)創(chuàng )性地提出了Vision-Language-Latent-Action (ViLLA) 架構,該架構由VLM(多模態(tài)大模型)+ MoE(混合專(zhuān)家)組成,可以利用人類(lèi)視頻學(xué)習,完成小樣本快速泛化,降低了具身智能門(mén)檻,并成功部署到智元多款機器人本體,持續進(jìn)化。

目前,靈犀X2目前初步具備了簡(jiǎn)單任務(wù)中對操作物體的零樣本泛化能力,比如給葡萄“縫合傷口”等精細活也不在話(huà)下。

當然,作為一款可能家用的機器人,靈犀X2還必須具有與人類(lèi)交互的能力。

在人機交互方面,靈犀X2搭載多模態(tài)交互大模型“硅光動(dòng)語(yǔ)”,并通過(guò)邊緣側“端到端”模型架構的工程優(yōu)化,使其具備毫秒級的交互反應能力,使其能夠通過(guò)人類(lèi)的面部表情和語(yǔ)音語(yǔ)調精準判斷情感狀態(tài),并做出相應的回應。靈犀X2還能模擬人類(lèi)的好奇心和注意力機制,有“偷看”“撓癢”等擬人化的表現。

彭志輝表示,硅光動(dòng)語(yǔ)中的“光”代表視覺(jué),“動(dòng)”代表動(dòng)作,“語(yǔ)”代表語(yǔ)音,因此也是第一臺真正具備復雜交互能力的“靈動(dòng)機器人”。目前該公司還在完善這款機器人的思維模型。

在這些技術(shù)的加持下,在彭志輝發(fā)布的視頻中,彭志輝已經(jīng)能和靈犀X2展開(kāi)正常聊天了。在問(wèn)題和答案并未預設的前提下,機器人對彭志輝提出的問(wèn)題一一作答,比如:

如果我的狗和你掉進(jìn)水里,我先救誰(shuí)?

如果給你看《銀翼殺手》你會(huì )不會(huì )哭到短路?

靈犀X2 回答的是「先救狗狗我沒(méi)事」,「不會(huì )哭但會(huì )感慨萬(wàn)千」。這類(lèi)語(yǔ)言表述自然,兼具「理性」與「感性」,甚至在回答的時(shí)候,它還會(huì )有手部動(dòng)作向你互動(dòng)。

欧日韩精品AⅤ视频|_一本大道在线无码一区_国产白浆精品永久网站_97人人模人人爽人人少妇