您的位置: 首頁 >科技 >

被稱為Pluribus的人工智能是六人無限制德州撲克的強大對手

2022-09-09 21:16:00 編輯:杜強若 來源:
導(dǎo)讀 UPPING ANTE計算機首次在多人撲克中擊敗了精英人類專業(yè)人士。人工智能已經(jīng)超過掌握撲克的最后一個重要里程碑:六人無限制德州撲克。像撲克...

UPPING ANTE計算機首次在多人撲克中擊敗了精英人類專業(yè)人士。

人工智能已經(jīng)超過掌握撲克的最后一個重要里程碑:六人無限制德州撲克。

像撲克這樣的游戲,隱藏的牌和虛張聲勢的玩家,對人工智能的挑戰(zhàn)要大于每個玩家都可以看到整個棋盤的游戲。在過去幾年中,計算機已成為日益復(fù)雜的一對一撲克形式,但多人游戲?qū)⑦@種復(fù)雜性提升到了一個新的水平(SN Online:5/13/15)。

研究人員在7月11日的“科學(xué)”雜志網(wǎng)絡(luò)版上報告說,現(xiàn)在,被稱為Pluribus的卡片鯊魚已經(jīng)在六人德州撲克中擊敗了十幾名精英專業(yè)人士。可以利用這些不穩(wěn)定的信息對幾個對手進(jìn)行策劃的算法可以成為精明的商業(yè)談判者,政治戰(zhàn)略家或網(wǎng)絡(luò)安全監(jiān)管機構(gòu)。

Pluribus通過對抗自己的副本來磨練其最初的策略,從頭開始逐步學(xué)習(xí)哪些行動有助于贏得。然后,人工智能使用這種直覺來確定何時保持以及何時在每手牌的第一輪下注期間對五個人類玩家進(jìn)行折疊。

在隨后的下注輪次中,Pluribus通過想象游戲如果采取不同的行動將如何發(fā)揮作用來微調(diào)其戰(zhàn)略。與為雙人撲克訓(xùn)練的人工智能不同,Pluribus沒有一直推測到游戲結(jié)束 - 在處理這么多玩家時需要進(jìn)行太多的計算(SN:4/1/17,第12頁) 。相反,人工智能想象了未來的幾個步驟,并根據(jù)那些假設(shè)的未來以及玩家可以采用的不同策略決定做什么。

在德州撲克的10,000手牌中,Pluribus與來自13名專業(yè)人士的五名參賽者進(jìn)行了比賽,他們都贏得了超過100萬美元的撲克玩家。每100手牌,Pluribus平均從其人類競爭者手中收入約480美元。

“這大致是精英人類專業(yè)人士渴望擊敗弱勢玩家的數(shù)量,”暗示Pluribus是一個比人類對手更精明的玩家,紐約市Facebook AI Research的諾姆布朗說。布朗與匹茲堡卡內(nèi)基梅隆大學(xué)的托馬斯·桑德霍爾姆一起創(chuàng)建了Pluribus。

現(xiàn)在人工智能已經(jīng)撲克,算法可以測試他們在具有更復(fù)雜的隱藏信息的游戲中的戰(zhàn)略推理,布拉格捷克技術(shù)大學(xué)的計算機科學(xué)家ViliamLisý說,他沒有參與這項工作。Lisja說,在像Kriegspiel這樣的游戲中,玩家無法看到對方的棋子 - 未知數(shù)可能會比靠近對手胸部的幾張牌變得復(fù)雜得多。

像“星際爭霸”這樣的視頻游戲,允許更多類型的動作和免費玩家進(jìn)行嚴(yán)格的回合制游戲,也可以作為人工智能聰明的新測試(SN:5/11/19,第34頁)。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。