您的位置: 首頁(yè) >精選綜合 >

當(dāng)你用VR訓(xùn)練機(jī)器人時(shí)你只需要教他們一次

2019-04-09 08:56:05 編輯: 來(lái)源:
導(dǎo)讀 如果你只需要向機(jī)器人展示一次任務(wù)怎么辦?OpenAI開(kāi)發(fā)了一種人工智能系統(tǒng),其中機(jī)器人可以從單個(gè)虛擬演示中學(xué)習(xí),并在不同的設(shè)置中重復(fù)現(xiàn)實(shí)

如果你只需要向機(jī)器人展示一次任務(wù)怎么辦?OpenAI開(kāi)發(fā)了一種人工智能系統(tǒng),其中機(jī)器人可以從單個(gè)虛擬演示中學(xué)習(xí),并在不同的設(shè)置中重復(fù)現(xiàn)實(shí)世界中的任務(wù)。最好的工人是你可以展示一次任務(wù)的人,然后讓他們從那時(shí)起完美地完成任務(wù)。雖然像Rethink Robotics的Baxter這樣的協(xié)作機(jī)器人能夠在真實(shí)世界的演練之后模仿裝配任務(wù),但教授機(jī)器人可能是一項(xiàng)耗時(shí)的物理任務(wù)。甚至一旦機(jī)器人被教導(dǎo),它就不一定能夠動(dòng)態(tài)地適應(yīng)這種情況。例如,在箱子中放置一個(gè)錯(cuò)位的部件可能會(huì)破壞機(jī)器人的整個(gè)過(guò)程。

OpenAI是一家非營(yíng)利性人工智能研究公司,它圍繞此開(kāi)發(fā)了一個(gè)解決方案 - 一個(gè)在虛擬現(xiàn)實(shí)(VR)環(huán)境中訓(xùn)練機(jī)器人的系統(tǒng)。成功部署后,此系統(tǒng)允許機(jī)器人僅在看到一次后才能學(xué)習(xí)任務(wù)。

OpenAI由特斯拉首席執(zhí)行官Elon Musk,PayPal創(chuàng)始人Peter Thiel和Y Combinator創(chuàng)始人Jessica Livingston等贊助商組成,他們創(chuàng)建了一個(gè)系統(tǒng)的工作原型,允許機(jī)器人學(xué)習(xí)并動(dòng)態(tài)執(zhí)行塊堆疊任務(wù)。希望這將是創(chuàng)建機(jī)器人和合作機(jī)器人的踏腳石,可以學(xué)習(xí)和適應(yīng)未來(lái)更復(fù)雜的任務(wù)。

您或您的團(tuán)隊(duì)每天都使用CAD和/或PLM軟件和工具。您習(xí)慣了工作流程,并學(xué)會(huì)了如何適應(yīng)限制。在本次網(wǎng)絡(luò)研討會(huì)中,您將了解可以無(wú)縫添加現(xiàn)有平臺(tái)的新工具,以改善工作流程并縮短工程時(shí)間。

“啟動(dòng)使人類(lèi)能夠迅速學(xué)習(xí)新的行為。我們也希望我們的機(jī)器人能夠這樣學(xué)習(xí),“技術(shù)人員OpenAI的成員Josh Tobin在OpenAI發(fā)布的視頻中解釋道。

該系統(tǒng)通過(guò)結(jié)合兩個(gè)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)來(lái)工作,一個(gè)用于視覺(jué),一個(gè)用于模仿。視覺(jué)網(wǎng)絡(luò)處理機(jī)器人的相機(jī)所看到的內(nèi)容,然后模仿網(wǎng)絡(luò)根據(jù)所看到的內(nèi)容確定機(jī)器人需要采取什么行動(dòng)來(lái)執(zhí)行其分配的任務(wù)。

使用稱(chēng)為域隨機(jī)化的方法訓(xùn)練系統(tǒng)的視覺(jué)部分,其允許模擬圖像與真實(shí)圖像相關(guān)聯(lián)。“我們生成了數(shù)以千計(jì)的物體位置,光照設(shè)置和表面紋理,并向神經(jīng)網(wǎng)絡(luò)展示了它們,”托賓說(shuō)。“經(jīng)過(guò)培訓(xùn),網(wǎng)絡(luò)可以在物理世界中找到塊,即使它之前從未見(jiàn)過(guò)來(lái)自相機(jī)的真實(shí)圖像。”

使用一次性模仿訓(xùn)練模仿神經(jīng)網(wǎng)絡(luò)?;旧?,當(dāng)使用一次性模仿時(shí),網(wǎng)絡(luò)學(xué)習(xí)任務(wù)(即將塊堆疊到塔中),然后計(jì)算出如何實(shí)現(xiàn)其結(jié)果而不管其情況如何。將其與視覺(jué)神經(jīng)網(wǎng)絡(luò)相結(jié)合意味著機(jī)器人能夠在各種條件下找出如何自行堆疊塊。每次都不需要將塊放置在相同的布置中,因?yàn)闄C(jī)器可以將塊重新對(duì)齊,然后將它們放置在需要它們的位置。

OpenAI并不是唯一一個(gè)希望使用虛擬模擬訓(xùn)練機(jī)器人的團(tuán)體。今年早些時(shí)候,GPU制造商N(yùn)vidia宣布推出Isaac,這是一個(gè)使用強(qiáng)化學(xué)習(xí)在虛擬環(huán)境中訓(xùn)練機(jī)器人的系統(tǒng)(讓機(jī)器人一遍又一遍地完成任務(wù)直到它正確完成)。Isaac系統(tǒng)部分利用OpenAI Gym,這是OpenAI發(fā)布的開(kāi)源工具包,用于開(kāi)發(fā)和比較AI算法。


免責(zé)聲明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ   備案號(hào):

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。

郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)