讓機器人能像兒童那樣學(xué)習(xí)
- 發(fā)布時間:2015-12-10 02:31:04 來源:科技日報 責(zé)任編輯:羅伯特
今日視點
本報記者 常麗君
孩子來到這個陌生的世界上,他們移動著自己的身體,探索著身體怎樣移動、怎樣抓住玩具、怎樣推開桌上的東西,同時觀察模仿著成人的做法,如此這般學(xué)習(xí)著這個世界的一切。
但如果讓機器人專家教一個機器人執(zhí)行任務(wù),一般情況下,他們只能靠編寫程序,或移動機器人的手臂或身體,如此告知它們?nèi)绾涡袆?。美國華盛頓大學(xué)計算機科學(xué)與工程教授拉加什·拉奧說:“你可以把這當(dāng)作是建造能向人類學(xué)習(xí)的機器人的第一步,它們的學(xué)習(xí)方法和兒童向大人學(xué)習(xí)是一樣的。如果讓那些絲毫不懂計算機程序的人去教一個機器人,只能用演示的方法——讓機器人看著怎么洗盤子、疊衣服、做家務(wù)。但要實現(xiàn)這一目標(biāo),機器人還要能看懂這些動作,并自己學(xué)著做出來?!?/p>
華盛頓大學(xué)機器人專家與該校學(xué)習(xí)與腦科學(xué)實驗室研究所副主管安德魯·麥茲奧夫合作,開發(fā)出一種新的概率模型,將兒童發(fā)育研究和機器學(xué)習(xí)方法結(jié)合起來,目標(biāo)是解決機器人技術(shù)中的根本性難題:造出能通過觀察和模仿人類來學(xué)習(xí)新技能的機器人。
兒童更擅于感知他人意圖
麥茲奧夫以往的研究表明,18個月大的兒童能推測出大人動作的意圖,并能想出其他方法達(dá)到他們想要的目的。
在一個案例中,兒童看到大人想拉開一個玩具杠鈴,但未達(dá)到目的,因為杠鈴是粘在一起的,大人的手滑到了杠鈴末端。兒童看著這一切,然后決定用另一種方法:用他的小手指抓住杠鈴末端,更加用力地猛拉——重復(fù)大人想要做的。
從某種程度上說,兒童更擅于感知他人的意圖,他們通過對自身的探索,學(xué)習(xí)物理規(guī)律,了解自己的行動對事物的影響,甚至能積累足夠的知識向他人學(xué)習(xí),并理解他們的意圖。麥茲奧夫認(rèn)為,兒童之所以能學(xué)習(xí)得那么快,原因之一就是他們特別愛玩。
“兒童在玩的時候,看起來是毫無目的,但卻是一種學(xué)習(xí)?!丙溒潑W夫說,“這正是兒童很有創(chuàng)造性的秘密。如果他們想知道怎么玩一個新玩具,就要用到玩其他玩具時的經(jīng)驗。在玩的過程中,他們也在學(xué)習(xí)著一種思維模式,即自己的行動會對外界造成怎樣的改變。一旦有了這種思維模式,他們就有了解決新問題的能力,并開始推測別人的意圖?!?/p>
用“學(xué)習(xí)概率模型”指導(dǎo)機器人
利用對兒童的研究,拉奧團隊開發(fā)了機器學(xué)習(xí)算法——一種學(xué)習(xí)概率模型:讓機器人觀察自己的動作,看不同動作可能帶來什么樣的不同后果,然后用這種學(xué)習(xí)概率模型,推測一個人究竟想做什么,并完成他的意圖,甚至在機器人無法確定時,還能“詢問”求助。
研究團隊用兩個不同的場景對他們的機器人模型進行了測試:一個是計算機模擬實驗,其中的機器人能通過追蹤人類的目光學(xué)習(xí);另一個是真的機器人,能通過模仿人類行動來學(xué)習(xí),比如移動桌子上的玩具。
在目光追蹤實驗中,機器人學(xué)習(xí)了一種如何移動頭部的規(guī)則模型,并假定人類轉(zhuǎn)頭也遵循這一模型。當(dāng)人在屋內(nèi)環(huán)視時,機器人會追蹤他頭部移動的起點和終點,用這些信息算出他在看什么地方,然后用學(xué)到的頭部運動規(guī)則,把自己的頭轉(zhuǎn)向人所看的地方。
研究人員還重復(fù)了麥茲奧夫?qū)和龅囊粋€實驗,讓一個大人看向某個地方然后蒙住眼睛時,兒童會對那個地方視而不見,或者也看向那里并蒙住眼睛,表示不感興趣,因為按他們的理解,大人其實是不想看那里。研究人員讓機器人“理解”蒙住眼睛(視而不見)的后果,它們就不再追蹤人類轉(zhuǎn)頭所看的地方。
“兒童通過自身的體驗來理解他人的行為,我們的機器人也是這樣?!丙溒潑W夫說。
在第二個實驗中,研究人員讓機器人模仿人類移動桌上的物體并把它們擦干凈。在學(xué)習(xí)模型的指導(dǎo)下,它們每次都不是生硬地模仿人類動作,有時還會用不同的方法來達(dá)到同樣目的。
華盛頓大學(xué)計算機科學(xué)與工程博士生鄭宰永說:“抓取、拿起、移動這些動作對機器人來說比推要困難,讓人類把一個物體拿到另一個位置或許更容易,也更可靠,但還要知道目的是什么,這是機器人技術(shù)中的一個難題,也是我們致力研究的問題。”
雖然實驗最初只是學(xué)習(xí)怎樣推斷目的、模仿簡單動作,但研究人員還打算探索這種模型能否幫助機器人學(xué)習(xí)更復(fù)雜的任務(wù)。
“兒童通過玩耍觀察別人來學(xué)習(xí)?!丙溒潑W夫說,“他們是地球上最棒的學(xué)習(xí)者——為什么不設(shè)計一種能像孩子那樣毫不費力學(xué)習(xí)的機器人呢?”
機器人(300024) 詳細(xì)
機器人 詳細(xì)
熱圖一覽
- 股票名稱 最新價 漲跌幅
- 最嚴(yán)調(diào)控下滬深房價仍漲 人口老齡化影響三四線樓市
- 樂天大規(guī)模退出中國市場 供應(yīng)商趕赴北京總部催款
- 北京16家銀行上調(diào)首套房貸利率 封殺“過道學(xué)區(qū)房”
- 10萬輛共享單車僅50人管遭質(zhì)疑 摩拜ofo優(yōu)勢變劣勢
- 去年聯(lián)通、電信凈利潤均下滑 用戶爭奪漸趨白熱化
- 奧迪否認(rèn)“官民不等價”:優(yōu)惠政策并非只針對公務(wù)員
- 季末銀行考核在即 一日風(fēng)云難改“錢緊錢貴”現(xiàn)狀
- 美圖7小時暴跌四成 虧損業(yè)績?nèi)绾沃?00億市值受拷問
- 監(jiān)管重壓下P2P退出平臺增加 網(wǎng)貸行業(yè)進入冷靜期
- 配資炒股虧損逾百萬 股民將信托公司告上法庭