研究人員開(kāi)發(fā)了一種識(shí)別計(jì)算機(jī)生成文本的方法

2019-07-27 10:26:38 編輯：來(lái)源：

導(dǎo)讀哈佛大學(xué)工程與應(yīng)用科學(xué)學(xué)院(SEAS)和IBM研究院的研究人員在一個(gè)深度偽造和遠(yuǎn)離人類自然語(yǔ)言AI的世界中問(wèn)道：有沒(méi)有更好的方法來(lái)幫助人們檢

哈佛大學(xué)工程與應(yīng)用科學(xué)學(xué)院(SEAS)和IBM研究院的研究人員在一個(gè)深度偽造和遠(yuǎn)離人類自然語(yǔ)言AI的世界中問(wèn)道：有沒(méi)有更好的方法來(lái)幫助人們檢測(cè)AI生成的文本?

這個(gè)問(wèn)題引發(fā)了Sebastian Gehrmann博士學(xué)位。SEAS的候選人和IBM的研究員Hendrik Strobelt開(kāi)發(fā)了一種統(tǒng)計(jì)方法，以及一個(gè)開(kāi)放式訪問(wèn) 交互式工具，用于檢測(cè)AI生成的文本。

自然語(yǔ)言生成器通過(guò)預(yù)測(cè)最常見(jiàn)的單詞來(lái)訓(xùn)練數(shù)以千萬(wàn)計(jì)的在線文本并模仿人類語(yǔ)言。例如，單詞“have”，“am”和“was”靜態(tài)地最有可能出現(xiàn)在單詞“I”之后。

使用這個(gè)想法，Gehrmann和Strobelt開(kāi)發(fā)了一種方法，它不是識(shí)別文本中的錯(cuò)誤，而是識(shí)別過(guò)于可預(yù)測(cè)的文本。

“我們的想法是，隨著模型變得越來(lái)越好，它們肯定比人類更糟糕，可檢測(cè)到，與人類一樣好或更好，這可能很難用傳統(tǒng)方法檢測(cè)到，”格爾曼說(shuō)。

“之前，你可以通過(guò)所有錯(cuò)誤來(lái)判斷文本是機(jī)器生成的，”Strobelt說(shuō)。“現(xiàn)在，它不再是錯(cuò)誤，而是使用極有可能(并且有點(diǎn)無(wú)聊)的單詞來(lái)調(diào)出機(jī)器生成的文本。通過(guò)這個(gè)工具，人類和AI可以一起工作來(lái)檢測(cè)假文本。”

Gehrmann和Strobelt將于7月28日至8月2日在SEAS的計(jì)算機(jī)語(yǔ)言學(xué)會(huì)(ACL)會(huì)議上與SEAS計(jì)算機(jī)科學(xué)副學(xué)士Alexander Rush共同撰寫他們的研究成果。

Gehrmann和Strobelt的方法，稱為GLTR，基于一個(gè)模型，該模型使用來(lái)自網(wǎng)站的4500萬(wàn)個(gè)文本 - 公共版本的OpenAI模型GPT-2。因?yàn)樗褂肎PT-2來(lái)檢測(cè)生成的文本，所以GLTR最適合GPT-2，但也可以很好地對(duì)抗其他模型。

以下是它的工作原理：

如果您將一段文本輸入到工具中，它會(huì)突出顯示綠色，黃色，紅色或紫色的文本，每種顏色都表示該單詞在其前面的單詞上下文中的可預(yù)測(cè)性。綠色意味著這個(gè)詞是非?？深A(yù)測(cè)的，黃色，適度可預(yù)測(cè)，紅色不可預(yù)測(cè)，紫色意味著模型根本不會(huì)預(yù)測(cè)這個(gè)詞。

標(biāo)簽：計(jì)算機(jī)生成文本