DeepMind使用神經(jīng)網(wǎng)絡(luò)來(lái)幫助解釋人們的元學(xué)習(xí)

2019-06-17 16:34:33 編輯：來(lái)源：

導(dǎo)讀由谷歌子公司DeepMind的一個(gè)小組領(lǐng)導(dǎo)的一個(gè)研究小組通過(guò)將其與計(jì)算機(jī)上的某種類型的深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行比較，開(kāi)發(fā)了一個(gè)關(guān)于人類元學(xué)習(xí)如何工

由谷歌子公司DeepMind的一個(gè)小組領(lǐng)導(dǎo)的一個(gè)研究小組通過(guò)將其與計(jì)算機(jī)上的某種類型的深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行比較，開(kāi)發(fā)了一個(gè)關(guān)于人類元學(xué)習(xí)如何工作的理論。在他們發(fā)表在“ 自然神經(jīng)科學(xué) ”雜志上的論文中，該小組認(rèn)為專門的計(jì)算機(jī)化神經(jīng)網(wǎng)絡(luò)中的關(guān)鍵要素可能類似于元學(xué)習(xí)過(guò)程中大腦中多巴胺的功能。

深度學(xué)習(xí)網(wǎng)絡(luò)雖然在運(yùn)行時(shí)非常令人印象深刻，但在一個(gè)領(lǐng)域仍然不足 - 他們需要花費(fèi)大量的時(shí)間和精力才能加快速度。最近的一個(gè)例子是編程為玩Pong等舊電腦游戲的神經(jīng)網(wǎng)絡(luò)。一個(gè)人可以掌握基礎(chǔ)知識(shí)，并在玩了一個(gè)下午之后變得非常精通。另一方面，神經(jīng)網(wǎng)絡(luò)需要數(shù)百小時(shí)的訓(xùn)練。神經(jīng)科學(xué)家認(rèn)為，這種差異是由于所謂的元學(xué)習(xí) - 一個(gè)人(或動(dòng)物)根據(jù)他們過(guò)去學(xué)到的東西學(xué)習(xí)如何做新事物。例如，猴子在首次學(xué)習(xí)通過(guò)隨機(jī)選擇學(xué)習(xí)后可以學(xué)習(xí)選擇不同的物體 - 這是哈洛實(shí)驗(yàn)中發(fā)現(xiàn)的一部分。

研究人員，例如DeepMind的研究人員，最近在使計(jì)算機(jī)參與元學(xué)習(xí)方面取得了進(jìn)展。當(dāng)然，他們這樣做的過(guò)程非常清楚，因?yàn)樗鼈兪鞘顾蔀楝F(xiàn)實(shí)的過(guò)程。然而，人類的情況仍然不明確。在這項(xiàng)新的努力中，DeepMind的團(tuán)隊(duì)認(rèn)為讓計(jì)算機(jī)參與元學(xué)習(xí)的關(guān)鍵因素之一可能類似于人類神經(jīng)網(wǎng)絡(luò)中發(fā)現(xiàn)的東西。

為了得出這個(gè)結(jié)論，該團(tuán)隊(duì)開(kāi)發(fā)了六個(gè)基于計(jì)算機(jī)的元學(xué)習(xí)實(shí)驗(yàn)，這些實(shí)驗(yàn)最初是動(dòng)物神經(jīng)科學(xué)實(shí)驗(yàn)的一部分，其中一個(gè)是Harlow實(shí)驗(yàn)。研究人員發(fā)現(xiàn)他們的深層神經(jīng)網(wǎng)絡(luò)反應(yīng)與原始實(shí)驗(yàn)中的動(dòng)物相似。此外，他們指出，每個(gè)實(shí)驗(yàn)所使用的常用成分是他們稱之為代理的東西 - 它需要引起元類型學(xué)習(xí)。他們指出，這可能表明動(dòng)物神經(jīng)網(wǎng)絡(luò)具有類似的生物因子，負(fù)責(zé)引起元學(xué)習(xí)。并且他們認(rèn)為藥劑可能是神經(jīng)遞質(zhì)多巴胺。

標(biāo)簽：神經(jīng)網(wǎng)絡(luò)