2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
Google今天宣布在Google翻譯中發(fā)布英語(yǔ)到西班牙語(yǔ)以及芬蘭語(yǔ),匈牙利語(yǔ)和波斯語(yǔ)到英語(yǔ)的性別專用翻譯,這些翻譯利用新的范例來(lái)通過(guò)重寫(xiě)或后期編輯初始翻譯來(lái)解決性別偏見(jiàn)。這家科技巨頭聲稱,這種方法比支持Google Translate的針對(duì)性別的土耳其語(yǔ)到英語(yǔ)翻譯的早期技術(shù)更具可擴(kuò)展性,主要是因?yàn)樗灰蕾囉跀?shù)據(jù)密集型的性別中立檢測(cè)器。
Google Research高級(jí)軟件工程師梅爾文·約翰遜(Melvin Johnson)寫(xiě)道:“自最初發(fā)布以來(lái),我們已經(jīng)取得了重大進(jìn)展,不僅提高了按性別劃分的翻譯質(zhì)量,還將其擴(kuò)展到另外4種語(yǔ)言對(duì)。”“我們致力于進(jìn)一步解決Google Translate中的性別偏見(jiàn),并計(jì)劃將這項(xiàng)工作擴(kuò)展到文檔級(jí)翻譯。”
正如約翰遜所解釋的那樣,用于土耳其語(yǔ)到英語(yǔ)性別特定翻譯的舊分類器很費(fèi)力地適應(yīng)新語(yǔ)言,但未能使用神經(jīng)機(jī)器翻譯(NMT)系統(tǒng)獨(dú)立生成男性和女性翻譯。而且,它無(wú)法顯示多達(dá)40%的合格查詢的針對(duì)性別的翻譯,因?yàn)槌詣e相關(guān)現(xiàn)象外,這兩種翻譯通常不完全相同。
相比之下,新的基于重寫(xiě)的方法首先生成翻譯,然后對(duì)其進(jìn)行審閱,以識(shí)別性別中立的源短語(yǔ)產(chǎn)生特定性別翻譯的實(shí)例。如果真是如此,那么句子級(jí)的重寫(xiě)者會(huì)選擇另一種性別翻譯,然后對(duì)第一和重寫(xiě)譯文進(jìn)行審核,以確保唯一的區(qū)別是性別。
根據(jù)Google的說(shuō)法,構(gòu)建重寫(xiě)器涉及生成數(shù)百萬(wàn)個(gè)由成對(duì)短語(yǔ)組成的訓(xùn)練示例,每個(gè)短語(yǔ)都包含男性和女性翻譯。由于數(shù)據(jù)不易獲得,因此Google Translate團(tuán)隊(duì)不得不從大型單語(yǔ)數(shù)據(jù)集開(kāi)始,通過(guò)將男性代詞從男性轉(zhuǎn)換為女性(或相反)來(lái)提出候選者重寫(xiě)。對(duì)于這種重寫(xiě)語(yǔ)料庫(kù),工程師采用了內(nèi)部語(yǔ)言模型,該模型對(duì)數(shù)百萬(wàn)個(gè)英語(yǔ)句子進(jìn)行了訓(xùn)練,以選擇最佳人選,從而將訓(xùn)練數(shù)據(jù)從男性輸入轉(zhuǎn)換為女性輸出,反之亦然。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。