您的位置: 首頁 >科技 >

研究人員探索自然語言處理以評估國際象棋動作

2022-06-25 03:52:01 編輯:蒲紅雄 來源:
導(dǎo)讀 國際象棋和人工智能再次出現(xiàn)在新聞中,這次是關(guān)于通過自然語言處理(NLP)探索國際象棋模型的團隊的報道。學(xué)習(xí)機制是國際象棋喋喋不休 -

國際象棋和人工智能再次出現(xiàn)在新聞中,這次是關(guān)于通過自然語言處理(NLP)探索國際象棋模型的團隊的報道。學(xué)習(xí)機制是國際象棋喋喋不休 - 精心挑選的聊天。他們預(yù)先訓(xùn)練了與國際象棋動作相關(guān)的評論情緒。情緒引導(dǎo)了代理人的決策。

他們產(chǎn)生的國際象棋算法旨在通過分析專家評論員的反應(yīng)來評估國際象棋動作的質(zhì)量。

倫敦大學(xué)學(xué)院的三位研究人員寫了一篇論文,描述了他們的方法和結(jié)果。Isaac Kamlish,Isaac Chocron和Nicholas McCarthy寫了“SentiMATE:學(xué)習(xí)通過自然語言處理來玩國際象棋”,它正在arXiv上。該文件于上個月提交。

“我們推出SentiMATE,一種新穎的國際象棋端到端深度學(xué)習(xí)模式,采用自然語言處理,旨在學(xué)習(xí)評估運動質(zhì)量的有效評估功能。該功能是根據(jù)與訓(xùn)練動作相關(guān)的評論情緒進行預(yù)先訓(xùn)練的,用于指導(dǎo)和優(yōu)化代理人的游戲決策。“

不要邀請AlphaZero和這個NLP模型參加同一個聚會; 他們會呆在房間的兩邊。研究人員寫道,Deep Mind的AlphaZero在經(jīng)過數(shù)百萬次自我游戲并使用數(shù)千個Tensor Processing Units(TPU)之后取得了成功。新研究并非如此。

相反,他們說,他們的目標(biāo)是“通過使用自然語言處理來評估個人運動的質(zhì)量......來自不同國際象棋網(wǎng)站的數(shù)據(jù)被刪除,其中包括有關(guān)正在采取的行動的信息,以及對定性評估由各種國際象棋選手撰寫的評論形式的動作本身;導(dǎo)致一個大型的動作數(shù)據(jù)庫,帶有注釋注釋。“

“它通過分析專家評論員的反應(yīng)來評估國際象棋動作的質(zhì)量,” 麻省理工學(xué)院技術(shù)評論的 Will Knight說。

他補充說,研究人員修剪了與高質(zhì)量動作無關(guān)的評論以及過于含糊不清的例子。“然后他們使用了一種特殊類型的遞歸神經(jīng)網(wǎng)絡(luò)和單詞嵌入(一種基于其意義連接單詞的數(shù)學(xué)技術(shù)),在另一種用于分析語言的最先進模型上進行訓(xùn)練。”

該算法稱為SentiMATE,它自己制定了國際象棋的基本規(guī)則以及幾種關(guān)鍵策略 - 包括分叉和鑄造。

該團隊發(fā)現(xiàn)SentiMATE能夠“基于預(yù)先訓(xùn)練的情緒評估功能來評估國際象棋動作”。他們的結(jié)論是,有強有力的證據(jù)支持自然語言處理用于訓(xùn)練國際象棋引擎中的評估功能。

他們解決方案的表現(xiàn)并不那么引人注目。奈特說,“它未能一直擊敗一些傳統(tǒng)的國際象棋機器人。” 但是,這不應(yīng)該分散SentiMATE工作的事實及其工作方式:

“SentiMATE讓研究人員感到驚訝,因為它有能力制定國際象棋的一些基本原則以及幾個關(guān)鍵策略,例如分叉(當(dāng)兩件或多件同時受到威脅時)和鑄造(當(dāng)國王和城堡都移動到作者說,在董事會的背后更具防守地位。

重要的是要努力設(shè)計這樣一個程序:語言是否可以用比傳統(tǒng)方法更少的練習(xí)數(shù)據(jù)來教授如何下象棋?

ZME Science的 Tibi Puiu 考慮到了這一點:

“只是這一次,他們的機器學(xué)習(xí)計劃沒有練習(xí)數(shù)百萬游戲來掌握國際象棋,而是分析了專家評論員的語言。有一天,研究人員說,類似的方法可以讓機器破譯情感語言并獲得可能具備的技能。否則無法通過'蠻力'進入。“

至于模型不是超級國際象棋冠軍,他說,“高級別的表現(xiàn)不是它的目標(biāo)。在SentiMATE閃耀的地方在于它使用語言獲得技能而不是練習(xí)它的能力。”

在他們的論文中,作者談到了支持他們研究的最重要的數(shù)據(jù)集。“在根據(jù)評論對數(shù)據(jù)集進行清理和分類,對國際象棋移動進行比較,并將情感分析應(yīng)用于評論時,我們向SentiChess提供了以比特格式表示的15,000張國際象棋移動的數(shù)據(jù)集,以及他們的評論和情緒評估。此數(shù)據(jù)集在希望進一步發(fā)展基于情感的國際象棋模型和統(tǒng)計移動分析的工作。“

展望未來,Will Knight表示游戲相關(guān)的聊天可以幫助AI程序?qū)W會以新的方式玩游戲。除了象棋之外,“同樣的技術(shù)可以讓機器使用我們語言的情感內(nèi)容來掌握各種實際任務(wù)。”


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。