麻省理工學(xué)院的研究人員發(fā)明了一種方法,可以有效地優(yōu)化用于目標(biāo)任務(wù)的軟機(jī)器人的控制和設(shè)計(jì),這在傳統(tǒng)上是一項(xiàng)艱巨的任務(wù)。
軟機(jī)器人具有彈性,柔性,可拉伸的主體,這些主體在任何給定時(shí)刻基本上可以移動(dòng)無數(shù)種方式。從計(jì)算上講,這代表了一個(gè)高度復(fù)雜的“狀態(tài)表示”,它描述了機(jī)器人各部分的運(yùn)動(dòng)方式。軟機(jī)器人的狀態(tài)表示可能具有數(shù)百萬個(gè)維度,這使得很難計(jì)算出使機(jī)器人完成復(fù)雜任務(wù)的最佳方式。
在下個(gè)月的神經(jīng)信息處理系統(tǒng)會(huì)議上,麻省理工學(xué)院的研究人員將提出一個(gè)模型,該模型根據(jù)機(jī)器人及其環(huán)境的基本物理特性,學(xué)習(xí)緊湊的或“低維”的詳細(xì)狀態(tài)表示形式。 。這有助于模型迭代地優(yōu)化滿足特定任務(wù)的運(yùn)動(dòng)控制和材料設(shè)計(jì)參數(shù)。
“軟機(jī)器人是無限維的生物,它們?cè)谌魏谓o定時(shí)刻都會(huì)以十億種不同的方式彎曲,”第一作者安德魯·斯皮爾伯格(Andrew Spielberg)說,他是計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)的研究生。“但是,實(shí)際上,軟物體可能會(huì)以自然方式彎曲。我們發(fā)現(xiàn)可以在低維描述中非常緊湊地描述軟機(jī)器人的自然狀態(tài)。我們通過學(xué)習(xí)良好的描述來優(yōu)化軟機(jī)器人的控制和設(shè)計(jì)可能的狀態(tài)。”
在仿真中,該模型使2D和3D軟機(jī)器人能夠比當(dāng)前最新技術(shù)更快,更準(zhǔn)確地完成任務(wù),例如移動(dòng)一定距離或到達(dá)目標(biāo)位置。研究人員接下來計(jì)劃在真正的軟機(jī)器人中實(shí)施該模型。
CSAIL的研究生Allan Zhao,Tao Du和Huyuanming則是與Spielberg一同加入本文的人。CSAIL總監(jiān)Daniela Rus以及電機(jī)工程和計(jì)算機(jī)科學(xué)系的Andrew and Erna Viterbi教授;麻省理工學(xué)院電氣工程和計(jì)算機(jī)科學(xué)副教授,計(jì)算制造小組負(fù)責(zé)人Wojciech Matusik。
“在環(huán)學(xué)習(xí)”
軟機(jī)器人技術(shù)是一個(gè)相對(duì)較新的研究領(lǐng)域,但它對(duì)高級(jí)機(jī)器人技術(shù)有希望。例如,柔性車身可以提供與人類更安全的交互,更好的對(duì)象操縱和更大的可操縱性,以及其他好處。
在仿真中對(duì)機(jī)器人的控制依賴于“觀察者”,該程序計(jì)算變量以查看軟機(jī)器人如何移動(dòng)以完成任務(wù)。在先前的工作中,研究人員將軟機(jī)器人分解為手工設(shè)計(jì)的模擬粒子簇。粒子包含重要信息,有助于縮小機(jī)器人的可能運(yùn)動(dòng)范圍。例如,如果機(jī)器人試圖以某種方式彎曲,則執(zhí)行器可能會(huì)對(duì)該移動(dòng)進(jìn)行足夠的抵抗,以至于可以忽略不計(jì)。但是,對(duì)于這種復(fù)雜的機(jī)器人,在仿真過程中手動(dòng)選擇要跟蹤的集群可能很棘手。
在這項(xiàng)工作的基礎(chǔ)上,研究人員設(shè)計(jì)了一種“循環(huán)中學(xué)習(xí)優(yōu)化”方法,其中所有優(yōu)化參數(shù)都是在許多模擬的單個(gè)反饋循環(huán)中學(xué)習(xí)的。并且,在學(xué)習(xí)優(yōu)化的同時(shí)(或“在循環(huán)中”)該方法還學(xué)習(xí)狀態(tài)表示。
該模型采用一種稱為“材料點(diǎn)方法”(MPM)的技術(shù),該技術(shù)可模擬被背景網(wǎng)格包圍的連續(xù)材料(例如泡沫和液體)顆粒的行為。這樣,它無需任何額外的計(jì)算就可以將機(jī)器人的粒子及其可觀察的環(huán)境捕獲為像素或3D像素(稱為體素)。
在學(xué)習(xí)階段,此原始粒子網(wǎng)格信息被饋送到機(jī)器學(xué)習(xí)組件,該組件學(xué)習(xí)輸入圖像,將其壓縮為低維表示,然后將表示解壓縮回輸入圖像。如果此“自動(dòng)編碼器”在壓縮輸入圖像時(shí)保留了足夠的細(xì)節(jié),則可以從壓縮中準(zhǔn)確地重新創(chuàng)建輸入圖像。
在研究人員的工作中,自動(dòng)編碼器學(xué)習(xí)到的壓縮表示形式用作機(jī)器人的低維狀態(tài)表示形式。在優(yōu)化階段,該壓縮表示形式將返回到控制器,該控制器將為機(jī)器人的每個(gè)粒子在下一個(gè)MPM模擬步驟中應(yīng)如何運(yùn)動(dòng)輸出計(jì)算出的驅(qū)動(dòng)力。
同時(shí),控制器使用該信息來調(diào)整每個(gè)粒子的最佳剛度,以實(shí)現(xiàn)其所需的運(yùn)動(dòng)。將來,該材料信息可能會(huì)用于3D打印軟機(jī)器人,在該3D打印軟機(jī)器人中,每個(gè)粒子點(diǎn)的打印硬度可能會(huì)略有不同。斯皮爾伯格說:“這允許根據(jù)機(jī)器人的動(dòng)作創(chuàng)建與特定任務(wù)相關(guān)的機(jī)器人設(shè)計(jì)。”“通過一起學(xué)習(xí)這些參數(shù),您可以使所有內(nèi)容盡可能地保持同步,從而使設(shè)計(jì)過程更加容易。”
優(yōu)化更快
依次將所有優(yōu)化信息反饋到循環(huán)的起點(diǎn),以訓(xùn)練自動(dòng)編碼器。在許多模擬中,控制器學(xué)習(xí)最佳運(yùn)動(dòng)和材料設(shè)計(jì),而自動(dòng)編碼器學(xué)習(xí)越來越詳細(xì)的狀態(tài)表示。斯皮爾伯格說:“關(guān)鍵是我們希望低維狀態(tài)具有很好的描述性。”
機(jī)器人在設(shè)定的時(shí)間段內(nèi)達(dá)到其模擬的最終狀態(tài)(例如,盡可能接近目標(biāo)位置)后,將更新“損失函數(shù)”。這是機(jī)器學(xué)習(xí)的關(guān)鍵組成部分,它試圖最大程度地減少一些錯(cuò)誤。在這種情況下,它可以使機(jī)器人距目標(biāo)的距離最小化。該損失函數(shù)流回到控制器,該控制器使用誤差信號(hào)調(diào)整所有優(yōu)化的參數(shù),以最好地完成任務(wù)。
斯皮爾伯格說,如果研究人員試圖將模擬的所有原始粒子直接送入控制器,而沒有壓縮步驟,則“運(yùn)行和優(yōu)化時(shí)間將會(huì)激增”。使用壓縮表示,研究人員能夠?qū)⒚看蝺?yōu)化迭代的運(yùn)行時(shí)間從幾分鐘減少到大約10秒。
研究人員通過對(duì)各種2D和3D兩足動(dòng)物和四足機(jī)器人的仿真驗(yàn)證了他們的模型。他們的研究人員還發(fā)現(xiàn),雖然使用傳統(tǒng)方法的機(jī)器人最多可以進(jìn)行30,000個(gè)仿真來優(yōu)化這些參數(shù),但是在模型上訓(xùn)練的機(jī)器人僅進(jìn)行了約400個(gè)仿真。
將模型部署到實(shí)際的軟機(jī)器人中意味著解決現(xiàn)實(shí)噪聲和不確定性問題,這可能會(huì)降低模型的效率和準(zhǔn)確性。但是,將來,研究人員希望為軟機(jī)器人設(shè)計(jì)從仿真到制造的完整流水線。