2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
谷歌今天宣布在谷歌翻譯中發(fā)布了從英語(yǔ)到西班牙語(yǔ)、芬蘭語(yǔ)、匈牙利語(yǔ)和波斯語(yǔ)到英語(yǔ)的性別翻譯,該翻譯利用了一種新的范式,通過(guò)重寫(xiě)或后期編輯最初的翻譯來(lái)解決性別偏見(jiàn)。這家科技巨頭聲稱,這種方法比之前支持谷歌Translate將性別特定性的土耳其語(yǔ)翻譯成英語(yǔ)的技術(shù)更具可擴(kuò)展性,主要是因?yàn)樗灰蕾囉跀?shù)據(jù)密集型的性別中立檢測(cè)器。
谷歌Research的高級(jí)軟件工程師梅爾文·約翰遜寫(xiě)道:“自從我們推出以來(lái),我們已經(jīng)取得了顯著的進(jìn)步,我們提高了性別翻譯的質(zhì)量,并將其擴(kuò)大到4對(duì)以上的語(yǔ)言對(duì)。”“我們致力于進(jìn)一步解決谷歌翻譯中的性別偏見(jiàn),并計(jì)劃將這項(xiàng)工作擴(kuò)展到文檔級(jí)翻譯。”
正如約翰遜所解釋的那樣,用于將突厥語(yǔ)翻譯成英語(yǔ)的性別分類器很難適應(yīng)新語(yǔ)言,因此無(wú)法使用神經(jīng)機(jī)器翻譯(NMT)系統(tǒng)獨(dú)立地生成男性化和女性化的翻譯。此外,在多達(dá)40%的符合條件的查詢中,它無(wú)法顯示針對(duì)性別的翻譯,因?yàn)槌伺c性別相關(guān)的現(xiàn)象外,這兩種翻譯通常并不完全相同。
相比之下,這種基于重寫(xiě)的新方法首先生成翻譯,然后對(duì)其進(jìn)行審查,以確定在哪些情況下,性別中立的源短語(yǔ)生成了性別特定的翻譯。如果是這樣的話,一個(gè)句子層次的改寫(xiě)者會(huì)拋出一個(gè)替代的性別化翻譯,第一個(gè)和重寫(xiě)的翻譯都會(huì)被審查,以確保性別是唯一的區(qū)別。
根據(jù)谷歌,構(gòu)建改寫(xiě)器涉及生成數(shù)百萬(wàn)個(gè)由詞組對(duì)組成的訓(xùn)練示例,每個(gè)詞組都包含陽(yáng)性和陰性的翻譯。因?yàn)閿?shù)據(jù)不容易獲得,谷歌翻譯團(tuán)隊(duì)必須想出候選人重寫(xiě)交換性別代詞從男性女性(或者相反),從一個(gè)大單語(yǔ)數(shù)據(jù)集。重寫(xiě)這個(gè)語(yǔ)料庫(kù),工程師運(yùn)用內(nèi)部語(yǔ)言模型訓(xùn)練在數(shù)以百萬(wàn)計(jì)的英語(yǔ)句子選擇最好的候選人,進(jìn)了訓(xùn)練數(shù)據(jù),從一個(gè)女性男性化的輸入輸出,反之亦然。
在合并來(lái)自兩個(gè)方向的訓(xùn)練數(shù)據(jù)之后,團(tuán)隊(duì)使用它來(lái)訓(xùn)練一個(gè)基于單層轉(zhuǎn)換的序列到序列模型。然后,他們?cè)谟?xùn)練數(shù)據(jù)中引入標(biāo)點(diǎn)符號(hào)和大小寫(xiě)變體,以增強(qiáng)模型的魯棒性,從而使最終的模型在99%的情況下都能可靠地生成所要求的陽(yáng)性或陰性重寫(xiě)。
谷歌度量稱為偏見(jiàn)減少評(píng)估,衡量之間的相對(duì)減少偏見(jiàn)新的翻譯系統(tǒng)和現(xiàn)有系統(tǒng)(“偏見(jiàn)”被定義為在性別選擇翻譯未指明的來(lái)源),約翰遜說(shuō),新方法導(dǎo)致偏見(jiàn)減少≥90%翻譯來(lái)自匈牙利、芬蘭,波斯英語(yǔ)?,F(xiàn)有的突厥語(yǔ)-英語(yǔ)翻譯系統(tǒng)的偏差減少率從60%提高到95%,該系統(tǒng)引發(fā)性別差異翻譯的平均準(zhǔn)確率為97%。在,當(dāng)它決定顯示性別特定的翻譯時(shí),97%的正確率。
改進(jìn)后的谷歌翻譯系統(tǒng)推出的幾個(gè)月前,谷歌通過(guò)其云視覺(jué)API取消了在圖像中將人標(biāo)記為“男人”或“女人”的功能。另外,在2018年1月,谷歌屏蔽了Smart Compose(一項(xiàng)Gmail功能,當(dāng)用戶鍵入句子時(shí),它會(huì)自動(dòng)為用戶推薦句子)和基于性別的代詞。
對(duì)語(yǔ)言翻譯和計(jì)算機(jī)視覺(jué)采取中性態(tài)度,是谷歌在減輕人工智能系統(tǒng)偏見(jiàn)方面所做的更大努力的一部分。這家山景城(Mountain View)的公司利用其人工智能道德團(tuán)隊(duì)開(kāi)發(fā)的測(cè)試來(lái)發(fā)現(xiàn)偏見(jiàn),并禁止其預(yù)測(cè)技術(shù)中出現(xiàn)咒罵、種族歧視、提及商業(yè)競(jìng)爭(zhēng)對(duì)手和悲劇事件等字眼。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。