2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
DeepMind的StarCraft IIAI已經(jīng)可以與人類玩家一起使用,但是現(xiàn)在它可以應(yīng)付最好的了。該團(tuán)隊(duì)透露,其AlphaStar AI可以在所有三個(gè)派系(Terran,Protoss,Zerg)的Grandmaster級(jí)別的實(shí)時(shí)策略游戲中進(jìn)行一對(duì)一的比賽。根據(jù)DeepMind的數(shù)據(jù),人工智能比Battle.net上的人類玩家高出99.8%。它也受到現(xiàn)實(shí)世界的限制,例如使用相同的虛擬攝像機(jī)視圖,有限的地圖信息,甚至每分鐘的操作數(shù)。訣竅是使用常規(guī)強(qiáng)化學(xué)習(xí)系統(tǒng)的修改版來(lái)模擬對(duì)《星際爭(zhēng)霸》職業(yè)玩家的訓(xùn)練。
通常將強(qiáng)化訓(xùn)練中的AI設(shè)置為最大化獲勝的機(jī)會(huì),但這并不一定要進(jìn)行強(qiáng)大的訓(xùn)練。該軟件可能只學(xué)習(xí)在狹窄的條件下表現(xiàn)出色,而對(duì)漏洞利用開(kāi)放。就像人類專家一樣,DeepMind的新方法使其中一個(gè)AI專注于利用對(duì)方的弱點(diǎn)。AlphaStar逐漸學(xué)會(huì)嘗試各種策略,這些策略可以對(duì)付非常規(guī)的,高度剝削性的策略(又名奶酪)
該技術(shù)仍有其局限性。首先,它需要比人類更多的訓(xùn)練來(lái)匹配同等水平的技能??紤]到《星際爭(zhēng)霸》的復(fù)雜性,這仍然是一項(xiàng)不小的壯舉,對(duì)于DeepMind的長(zhǎng)期計(jì)劃而言,這是個(gè)好兆頭。與公司早期的游戲研究一樣,最終計(jì)劃是將AlphaStar的進(jìn)步轉(zhuǎn)化為現(xiàn)實(shí)應(yīng)用。訓(xùn)練有素的AI可以幫助自動(dòng)駕駛汽車(chē)和機(jī)器人處理不習(xí)慣處理的異常情況。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。