新聞源 財富源

2025年01月10日 星期五

財經(jīng) > 滾動新聞 > 正文

字號:  

學抓物,練調(diào)酒,學習軟件做幫手

  • 發(fā)布時間:2015-10-27 01:31:15  來源:科技日報  作者:佚名  責任編輯:羅伯特

  本報記者房琳琳綜合外電

  機器人在現(xiàn)代制造業(yè)上發(fā)揮著不可替代的作用,然而,更安全、更便宜特別是更智能的機器人還是供不應求。

  隨著材料科學、計算機科學、大腦科學等領域的快速發(fā)展,機器人雖然距離科幻電影中的形象還相去甚遠,但隨著“學習”能力的不斷提升,開發(fā)和拓展機器人與現(xiàn)實世界互動的科技實踐,卻無時不刻震撼著你我的眼球。雖然,每一次學習都只進步了一點點,但正是這“一點點”的進步,終將匯聚成未來的智能世界。

  美國《麻省理工技術評論》10月份以來發(fā)布了幾篇有關機器人學習能力新動向的文章,或許對機器人發(fā)燒友來說,是個有趣的、跟蹤最新技術方向的重要參考。

  “自學”抓取多種物品

  一般用途機器人的目標之一,就是與日常生活中的物品以智能的方式互動,但是機器人的抓取能力實在差到令人尷尬。讓機器人撿起一個電視遙控器、一瓶水或者一個玩具槍,它都會無休止地去摸索,除非再編制一個讓它在特定環(huán)境下?lián)炱鹛囟ㄎ锲返某绦颉?/p>

  這與人類抓取東西的能力形成鮮明對比。一個人類嬰兒能夠在最混亂和非結構化的環(huán)境下,快速學會抓取特定的物品。

  那么,機器人能像嬰兒那樣通過反復試驗和糾錯來學習抓握嗎?

  如今,卡耐基梅隆大學的里瑞爾·平托和阿波西納威·敢普塔證明了這種可能性。他們?yōu)槊麨榘涂怂固氐臋C器人裝載了深度學習功能,讓它在堆滿了一桌子的日常物品中,像嬰兒那樣坐在桌子前的高椅上自己學習。

  巴克斯特是一個現(xiàn)代化的兩臂工業(yè)機器人,被設計成可在工廠車間環(huán)境下執(zhí)行重復性任務。它的每個胳膊都由一個標準的兩指平行爪和一個能讓機器人看清楚去抓什么的高清攝像頭,它還有一個微軟Kinect傳感器,提供一覽無余的視角。

  平托和敢普塔為巴克斯特編程,通過與其他“鄰居”隔離的方式單獨抓取一個物品,然后在桌子上隨機找到一個點,讓機器人的兩指平行爪旋轉(zhuǎn)一定的角度后直接抓取這個物品。機器人隨后會舉起胳膊、通過力量傳感器來明確抓握是否已經(jīng)成功,這個過程重復188次,每次轉(zhuǎn)換的角度是10度。

  為了讓機器人更好地學習,平托和敢普塔在巴克斯特的桌子前面放了很多物品,并讓它獨自在那里一呆就是10個小時,中間不許人類干涉。如果機器人將物品掉落在地板上,桌面上還有很多替代的物品可以供其不間斷地練習。

  巴克斯特的深度學習方法非常標準,研究人員為它裝載了一個常規(guī)的神經(jīng)網(wǎng)絡,能夠在學習抓握之前具備一些基本的對象識別技能。然而,仍有兩個網(wǎng)絡層面需要用于隨機抓取經(jīng)驗的學習。

  研究團隊利用第二個學習層面來改進巴克斯特的技能。在選取了一些基本的物品之后,他們提供給巴克斯特一些新的東西,里面有它見過的,還有對它來說全新的物件。

  超過700個小時后,巴克斯特對150種物品嘗試了5萬次抓取(包括未成功的抓?。?。這些物品包括電視遙控器、很多不同的塑料玩具,還有一些大小類似的物品。這讓巴克斯特可以預測出是否能抓取成功的幾率達到80%。

  像使巴克斯特這樣與世界產(chǎn)生互動的有趣研究將產(chǎn)生重要的影響。關鍵之處是,巴克斯特像人那樣很容易就適應了雜亂的相對沒有規(guī)矩的環(huán)境。更重要的是,抓握物品的技能基本上是靠自學完成的。

  當然了,巴克斯特和它的神經(jīng)網(wǎng)絡要像嬰兒那樣靈活自如還有很長的路要走。下一步需要學的技能是學習抓握的力度,這樣在拿到脆弱的物品時不至于將之毀于一旦。

  可能最終對巴克斯特的測試會是挑戰(zhàn)牙膏——將豆粒大小的牙膏擠在牙刷上。畢竟,這是人類從小要學會的很重要的一件事情。

  看視頻學會調(diào)制雞尾酒

  工業(yè)機器人要執(zhí)行一個復雜的新任務,需要花上數(shù)周時間來重新編程,這讓現(xiàn)代制造業(yè)生產(chǎn)線的重組變得十分昂貴和緩慢。

  如果機器人能夠在勝任新工作之前看著別人先做一遍,整個進程可能會用“突飛猛進”來形容。這是美國馬里蘭大學執(zhí)行的一個項目中的“點子”,他們正在教育機器人成為“勤勉的學生”。

  馬里蘭大學自主性、機器人與認知實驗室的楊葉舟(音)說:“我們叫它‘機器人培訓學院’。我們請專家給機器人演示一遍任務,并讓機器人按照任務的流程完成大部分工作,然后微調(diào)一下完成任務?!?/p>

  在圣路易斯召開的一次相關會議上,研究人員展示了一個能調(diào)制雞尾酒的機器人,正是用了上述方法完成了調(diào)制任務。這個擁有兩個工業(yè)化機械手臂的家伙來自波士頓一家名為“重新思考機器人”的公司。一個人從幾個瓶子中倒出液體后在一個小壇子里混合成一杯飲品,機器人觀看了整個過程,復制下所有的動作,關鍵是,它抓起瓶子的順序是正確的。

  這需要訓練一個計算機系統(tǒng)與特殊的機器人動作相適應。該研究團隊最近的一篇論文指出,一個機器人學會選取不同的物品,需要使用兩套不同的系統(tǒng)來觀看數(shù)千遍的教學視頻,一個系統(tǒng)是學習如何識別不同的物品,另一個系統(tǒng)是明確不同類型的抓握動作。

  觀看數(shù)千遍的教學視頻可能聽起來很費時間,但是學習的過程比重新對機器人編程效率高得多,重要的是,它很容易讓機器人“上手”新任務。用于抓握動作的學習系統(tǒng)包含了先進的人工神經(jīng)網(wǎng)絡,這種技術近幾年取得了快速發(fā)展,現(xiàn)在正如火如荼地被用于開發(fā)多種類型的機器人。

  研究人員正在向包括電子商務、汽車制造商在內(nèi)的幾家制造業(yè)公司推介它們的學習機器人,看是否能將這個新技術應用于工業(yè)生產(chǎn)。這些公司也曾為了拓展機器人工作任務找過工程師重新對機器人編程,但大多數(shù)都需要一個半月或者更長的時間才能搞定。楊葉舟說:“用我們的方法至少可以節(jié)省一半時間?!?/p>

  該項目反映了機器人行業(yè)的兩大發(fā)展趨勢,一個是找到機器人學習的新方法,另一個是機器人可最大程度地以人類工作的方式進行操作。

  機器人也用學習軟件

  機器人技術的迅速推進,部分原因在于硬件,包括計算機芯片、傳感器和執(zhí)行器的研究進展,但是軟件也同樣推進了技術進步。例如,開源的機器人操作系統(tǒng)讓工程師為機器人增加新的技能變得更容易,這樣就不必要都從零開始。

  小孩子在蹣跚學步的時候能快速識別一頓美味或者避免抓住帶刺的東西,近日發(fā)布的一個軟件能讓機器人通過經(jīng)驗學習而非編輯程序,也能如此智能。

  先進的機器學習軟件,比如Brain OS能夠讓機器人看到更先進的技能,也能夠讓機器人學習更為先進的技術經(jīng)驗。

  Brain OS由一家位于美國圣地亞哥的移動芯片制造商高通公司支持的“大腦公司”開發(fā)。這樣的軟件最終讓機器人更容易被使用。使用Brain OS的用戶不需要編寫新的代碼或者訪問圖形用戶界面,就能輕松地訓練機器人做一些簡單的任務,比如朝著特定的物體移動。

  對于機器人來說,在復雜的、不斷變換的環(huán)境中穩(wěn)定地工作是非常困難的事情,這就是要將學習能力變成可靠途徑的一個重要原因。一些商業(yè)化的機器人已經(jīng)能夠進行簡單的學習,但是Brain OS軟件包含了一系列為機器人學習提供的工具,可以讓機器人工程師更容易進入這個軟件庫,來為機器人獲取諸如對象識別、導航和操作任務的程序。

  去年在波士頓舉辦的機器人會議上,大腦公司展示了這款軟件,當時該公司用一個紅色原型機器人拼裝成一個由兩只攝像頭做眼睛的賽格威電動平衡車,它把一個對象展示給機器人,然后機器人能夠跟隨物體,不離不棄。

  Brain OS利用的學習能力包括給能模擬神經(jīng)元和突觸的虛擬網(wǎng)絡提供信息,然后提供正面或者反面的反饋,這個過程被稱為“監(jiān)督學習”。近年來這種學習方法因非常有效而備受矚目。

  大腦公司的執(zhí)行副總裁托德·希爾頓在一份聲明中說,機器學習軟件大多數(shù)針對學術研究人員而不是工業(yè)工程師?!癇rain OS通過提供接近原型的、可商業(yè)化的機器人應用中央技術框架來解決這個問題”。

  大腦公司還發(fā)布了一個由高通公司開發(fā)的被稱為bStem(腦干的簡稱)的軟件版芯片。該芯片可以用來設計模擬大腦工作的方式,并行存儲和處理數(shù)據(jù)。這樣的“神經(jīng)形態(tài)”芯片可以被用來高效運行模擬神經(jīng)網(wǎng)絡,高通公司也是希望將這種技術商業(yè)化的公司之一。

熱圖一覽

  • 股票名稱 最新價 漲跌幅