您的位置: 首頁(yè) >互聯(lián)網(wǎng) >

DeepMind使用神經(jīng)網(wǎng)絡(luò)來(lái)幫助解釋人們的元學(xué)習(xí)

2019-06-17 16:34:33 編輯: 來(lái)源:
導(dǎo)讀 由谷歌子公司DeepMind的一個(gè)小組領(lǐng)導(dǎo)的一個(gè)研究小組通過(guò)將其與計(jì)算機(jī)上的某種類型的深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行比較,開發(fā)了一個(gè)關(guān)于人類元學(xué)習(xí)如何工

由谷歌子公司DeepMind的一個(gè)小組領(lǐng)導(dǎo)的一個(gè)研究小組通過(guò)將其與計(jì)算機(jī)上的某種類型的深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行比較,開發(fā)了一個(gè)關(guān)于人類元學(xué)習(xí)如何工作的理論。在他們發(fā)表在“ 自然神經(jīng)科學(xué) ”雜志上的論文中,該小組認(rèn)為專門的計(jì)算機(jī)化神經(jīng)網(wǎng)絡(luò)中的關(guān)鍵要素可能類似于元學(xué)習(xí)過(guò)程中大腦中多巴胺的功能。

深度學(xué)習(xí)網(wǎng)絡(luò)雖然在運(yùn)行時(shí)非常令人印象深刻,但在一個(gè)領(lǐng)域仍然不足 - 他們需要花費(fèi)大量的時(shí)間和精力才能加快速度。最近的一個(gè)例子是編程為玩Pong等舊電腦游戲的神經(jīng)網(wǎng)絡(luò)。一個(gè)人可以掌握基礎(chǔ)知識(shí),并在玩了一個(gè)下午之后變得非常精通。另一方面,神經(jīng)網(wǎng)絡(luò)需要數(shù)百小時(shí)的訓(xùn)練。神經(jīng)科學(xué)家認(rèn)為,這種差異是由于所謂的元學(xué)習(xí) - 一個(gè)人(或動(dòng)物)根據(jù)他們過(guò)去學(xué)到的東西學(xué)習(xí)如何做新事物。例如,猴子在首次學(xué)習(xí)通過(guò)隨機(jī)選擇學(xué)習(xí)后可以學(xué)習(xí)選擇不同的物體 - 這是哈洛實(shí)驗(yàn)中發(fā)現(xiàn)的一部分。

研究人員,例如DeepMind的研究人員,最近在使計(jì)算機(jī)參與元學(xué)習(xí)方面取得了進(jìn)展。當(dāng)然,他們這樣做的過(guò)程非常清楚,因?yàn)樗鼈兪鞘顾蔀楝F(xiàn)實(shí)的過(guò)程。然而,人類的情況仍然不明確。在這項(xiàng)新的努力中,DeepMind的團(tuán)隊(duì)認(rèn)為讓計(jì)算機(jī)參與元學(xué)習(xí)的關(guān)鍵因素之一可能類似于人類神經(jīng)網(wǎng)絡(luò)中發(fā)現(xiàn)的東西。

為了得出這個(gè)結(jié)論,該團(tuán)隊(duì)開發(fā)了六個(gè)基于計(jì)算機(jī)的元學(xué)習(xí)實(shí)驗(yàn),這些實(shí)驗(yàn)最初是動(dòng)物神經(jīng)科學(xué)實(shí)驗(yàn)的一部分,其中一個(gè)是Harlow實(shí)驗(yàn)。研究人員發(fā)現(xiàn)他們的深層神經(jīng)網(wǎng)絡(luò)反應(yīng)與原始實(shí)驗(yàn)中的動(dòng)物相似。此外,他們指出,每個(gè)實(shí)驗(yàn)所使用的常用成分是他們稱之為代理的東西 - 它需要引起元類型學(xué)習(xí)。他們指出,這可能表明動(dòng)物神經(jīng)網(wǎng)絡(luò)具有類似的生物因子,負(fù)責(zé)引起元學(xué)習(xí)。并且他們認(rèn)為藥劑可能是神經(jīng)遞質(zhì)多巴胺。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。