2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
人工智能已經(jīng)超越了掌握撲克的最后一個(gè)重要里程碑:六人無限制德州撲克。
比起每個(gè)玩家都能看到整個(gè)局面的游戲,像撲克這樣的具有隱藏卡和虛張聲勢(shì)的玩家的游戲,對(duì)AI的挑戰(zhàn)更大。在過去的幾年中,計(jì)算機(jī)已經(jīng)成為越來越復(fù)雜的一對(duì)一撲克形式的王牌,但是多人游戲?qū)⑦@種復(fù)雜性提升到了一個(gè)新水平(SN在線:5/13/15)。
研究人員在7月11日的《科學(xué)》網(wǎng)上報(bào)道說,如今,一個(gè)被稱為Pluribus的紙牌鯊AI在六人制德州撲克比賽中勝過了十幾位精英專業(yè)人士??梢允褂么祟悈⒉畈积R的信息針對(duì)多個(gè)對(duì)手進(jìn)行密謀的算法可能會(huì)使精明的業(yè)務(wù)談判人員,政治策略師或網(wǎng)絡(luò)安全監(jiān)督者成為現(xiàn)實(shí)。
Pluribus通過與自己的副本進(jìn)行對(duì)抗來磨練其初始策略,從頭開始,逐步了解哪些行動(dòng)有助于贏得勝利。然后,AI在每個(gè)手對(duì)五位人類玩家的第一輪下注中使用該直覺來確定何時(shí)握住和何時(shí)折疊。
在隨后的下注回合中,Pluribus想象了如果采取不同的動(dòng)作游戲會(huì)如何進(jìn)行,從而對(duì)其策略進(jìn)行了微調(diào)。與為兩人撲克訓(xùn)練的人工智能不同,Pluribus并沒有完全推測(cè)到游戲結(jié)束–與如此多的玩家打交道時(shí),這將需要太多的計(jì)算(SN:4/1/17,第12頁(yè)) 。取而代之的是,AI設(shè)想了一些前進(jìn)的步伐,并根據(jù)那些假設(shè)的未來和玩家可以采用的不同策略來決定要做什么。
在10,000張德州撲克比賽中,Pluribus與來自13位專業(yè)人員的五名選手競(jìng)爭(zhēng),他們?nèi)口A得了超過100萬美元的撲克游戲。每100手牌中,Pluribus平均從其人類競(jìng)爭(zhēng)對(duì)手中贏利480美元。
紐約市Facebook AI Research的諾姆·布朗(Noam Brown)說:“這大約是精英人類專業(yè)人士所希望擊敗的弱者,”這意味著Pluribus比其人類對(duì)手更聰明。布朗與匹茲堡卡內(nèi)基梅隆大學(xué)的托馬斯·桑德霍爾姆共同創(chuàng)建了普里布斯。
布拉格捷克技術(shù)大學(xué)的計(jì)算機(jī)科學(xué)家ViliamLisý表示,既然現(xiàn)在AI已經(jīng)掌握了撲克,算法就可以在游戲中使用更復(fù)雜的隱藏信息來測(cè)試其戰(zhàn)略推理,他沒有參與這項(xiàng)工作。Lisý說,在像Kriegspiel這樣的游戲中(象棋副產(chǎn)品,玩家看不到彼此的棋子),未知數(shù)會(huì)比在對(duì)手胸前緊握幾張紙牌復(fù)雜得多。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。