2016-2022 All Rights Reserved.平安財經網.復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網 版權歸原作者所有。
這個世界上沒有任何東西 - 動物或機器人 - 非常接近人手的靈活性和靈活性。對于Elon Musk創(chuàng)立的非營利組織OpenAI的工程師來說,這既是挑戰(zhàn)也是機遇。他們的研究人員如何使用人工智能來教導機器人像人一樣巧妙地操縱物體?
通常,在教授AI來控制物理機器人時,科學家們往往會遇到同樣的問題。培訓通常使用強化學習來完成; AI通過反復試驗過程學習的方法。但這需要很多時間,通常相當于多年的經驗。如果你想讓AI擊敗一個視頻游戲,那就沒關系了 - 你只是讓它以更快的速度玩游戲。但如果你想教它一個真實的任務,那你就麻煩了。你不能等待機器人手臂經歷多年的練習,并且很難模擬世界上足夠準確的訓練目的。
對于OpenAI,他們自己設定的任務是教一個機器人手來操縱一個六面立方體; 將它從一個位置移動到另一個位置,使特定的一面朝上。與早期的研究一樣,他們首先盡可能準確地模擬這種環(huán)境,但他們的下一步是產生差異:他們開始搞亂模擬。
首先,他們添加了隨機視覺噪音。然后,他們改變了虛擬手和立方體的顏色。他們隨機化了立方體的大小; 它的表面有多滑; 它有多重 他們甚至搞砸了模擬的引力。所有這一切的效果是讓AI更好地理解在現(xiàn)實世界中操縱立方體的可能性。雖然模擬可能不完全真實,但它有足夠的變化,它允許系統(tǒng)學會處理意外。
參與該項目的OpenAI的Matthias Plappert解釋說,改變模擬的引力是一個特別有趣的黑客。該團隊知道,當AI系統(tǒng)(稱為Dactyl)正在控制一個真正的機器人手時,手的基部每次可能不會以相同的角度定位。較低的角度意味著立方體將更容易從手中掉落。為了教Dactyl如何處理這個變體,他們決定將模擬中的重力隨機化。“沒有這種隨機化,它就會一直丟棄物體,因為它不習慣它,”Plappert說。
通過所有這些隨機化需要很長時間。很長一段時間。事實上,Dactyl必須積累大約100年的經驗才能達到最佳表現(xiàn)。反過來,這意味著團隊必須使用大量的計算能力 - 大約6,144個CPU和8個強大的強大Nvidia V100 GPU。這種硬件只有極少數(shù)研究機構才能使用。
但最終的結果是值得的,Plappert說。完成訓練后,Dactyl能夠將立方體從一個位置移動到另一個位置,連續(xù)50次,而不會掉落。(盡管它這樣做的中位數(shù)要小得多;只有13個。)在學習手中移動立方體的過程中,Dactyl甚至開發(fā)了類似人類的行為。所有這些都是在沒有任何人為指導的情況下學到的 - 只是反復試驗,幾十年一次。
“這表明我們人類對操控的作用非常優(yōu)化,”Plappert說。“當你看到一個試圖解決問題的機器人時,這是一個非常有趣的時刻,你會想'噢,嘿,那也是我會這樣做的。'”
機器人技術和人工智能領域的專家對The Verge的評論贊揚了OpenAI的工作,但警告說它并不代表機器人操縱的突破??▋然仿〈髮W機器人研究所的Smruti Amarjyoti指出,隨機化系統(tǒng)訓練環(huán)境的想法之前已經完成,但是說Dactyl的動作是“優(yōu)雅的”,他認為AI是不可能的。
“最終的結果是非常復雜和精致,”Amarjyoti說。“[但]我認為OpenAI在這一領域的最大成就將是它所采用的工程協(xié)調以及用于實現(xiàn)這一壯舉的計算能力。”
Istituto Italiano di Tecnologia的機器人學教授安東尼奧·比奇(Antonio Bicchi)表示,這項研究“優(yōu)雅而令人著迷”,但指出了一些局限性。“結果仍然局限于一個特定的任務(滾動一個方便大小的模具)在相當有利的條件下(手朝上,所以骰子落在掌中),甚至不是一個確鑿的論據(jù),這些技術可以解決現(xiàn)實世界的機器人問題,“比奇說。
對于OpenAI來說,研究對于Dactyl骰子雜耍之外的原因是令人滿意的。該系統(tǒng)使用了許多與實驗室開發(fā)的相同算法和技術來教授其視頻游戲機器人 OpenAI Five。該公司建議,這表明它正在構建通用算法,可以用來處理各種各樣的任務 - 對于雄心勃勃的AI實驗室和公司來說,這是一個圣杯。
在人工智能的幫助下創(chuàng)建更靈巧的機器人對于嘗試自動化手工勞動的公司來說將是一個巨大的福音,并且有許多初創(chuàng)公司積極地在該領域進行研究。但是,雖然提高機器人技術的先進水平當然可以讓更多的工作崗位自動化,但是這種工作破壞浪潮是否可以被新技術創(chuàng)造的工作所抵消,這是一個懸而未決的問題。
無論哪種方式,很明顯人工智能仍然有一條路可以匹配人類的運動技能。Bicchi指出,使用Dactyl將近百年學習的能力可以被“只有極少數(shù)試驗,甚至是新物體和任務的人”所接受。但當然機器正在趕上,比以往任何時候都要快。
2016-2022 All Rights Reserved.平安財經網.復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網 版權歸原作者所有。