迄今為止,教導(dǎo)機器人執(zhí)行任務(wù)通常涉及直接編碼,反復(fù)試驗或手持機器。但是很快,您可能只需要像前一天一樣執(zhí)行該任務(wù)。麻省理工學(xué)院的科學(xué)家們開發(fā)了一個系統(tǒng),即“不確定規(guī)格計劃”(PUnS),該系統(tǒng)可以幫助機器人學(xué)習(xí)復(fù)雜的任務(wù),否則他們會遇到麻煩,例如設(shè)置餐桌。PUnS代替了機器人因執(zhí)行正確的動作而獲得獎勵的通常方法,而是讓機器人對各種規(guī)格持有“信念”,并使用一種語言(線性時態(tài)邏輯)讓其推理現(xiàn)在要做的事情并在未來。
為了將機器人推向正確的結(jié)果,團隊設(shè)定了有助于機器人滿足其整體信念的標(biāo)準(zhǔn)。這些標(biāo)準(zhǔn)可以滿足概率最高,公式數(shù)量最多,甚至失敗幾率最小的公式。如果使用危險材料,設(shè)計人員可以優(yōu)化機器人的安全性;如果是工廠模型,設(shè)計人員可以優(yōu)化其質(zhì)量。
MIT的系統(tǒng)在早期測試中比傳統(tǒng)方法有效得多。基于PUnS的機器人在設(shè)置桌子的20,000次嘗試中僅犯了6個錯誤,即使研究人員出現(xiàn)了諸如隱藏叉子之類的麻煩時,自動機也完成了其余任務(wù),并在彈出時回到了叉子。這樣,它表現(xiàn)出了類似人的能力,可以設(shè)定明確的總體目標(biāo)和即興創(chuàng)作。
開發(fā)人員最終希望該系統(tǒng)不僅可以通過觀看來學(xué)習(xí),還可以對反饋做出反應(yīng)。例如,您可以對其進行口頭更正或?qū)ζ湫阅苓M行批評。這將涉及更多工作,但它暗示著家用機器人可以通過樹立榜樣來適應(yīng)新職責(zé)的未來。