2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
小編發(fā)現(xiàn)不少朋友對(duì)于Siri與Alexa和Google Assistant語音技術(shù)的研究表明培訓(xùn)數(shù)據(jù)存在偏見 這方面的信息都比較感興趣,小編就針對(duì) Siri與Alexa和Google Assistant語音技術(shù)的研究表明培訓(xùn)數(shù)據(jù)存在偏見整理了一些相關(guān)方面的信息在這里分享給大家。
一項(xiàng)新的研究發(fā)現(xiàn),來自大型科??技公司的語音識(shí)別系統(tǒng)很難理解黑人所說的單詞,而很難理解。
這些類型的系統(tǒng)通常用于數(shù)字助理(如Siri)以及諸如隱藏式字幕和免提控件之類的工具。但是,與任何機(jī)器學(xué)習(xí)系統(tǒng)一樣,其準(zhǔn)確性僅與數(shù)據(jù)集一樣好。
斯坦福大學(xué)在《科學(xué)院院刊》上發(fā)表的一項(xiàng)研究顯示,由蘋果,谷歌和Facebook等公司開發(fā)的自動(dòng)語音識(shí)別(ASR)系統(tǒng)在抄錄非裔人的語音時(shí),出錯(cuò)率往往高于。
研究人員進(jìn)行了115次人工轉(zhuǎn)錄訪談,并將其與語音識(shí)別工具進(jìn)行的訪談進(jìn)行了比較。在這些對(duì)話中,有73次與黑人演講者進(jìn)行對(duì)話,而42次與演講者進(jìn)行對(duì)話。
研究小組發(fā)現(xiàn),ASR系統(tǒng)轉(zhuǎn)錄黑色語音時(shí),“平均單詞錯(cuò)誤率”幾乎翻了一番(35%),而轉(zhuǎn)錄白色語音時(shí)為19%。
為了排除詞匯和方言的差異,研究人員還按性別和年齡匹配了語音,并讓講者說出相同的單詞。即使這樣,他們發(fā)現(xiàn)黑色揚(yáng)聲器的錯(cuò)誤率幾乎是白色揚(yáng)聲器的兩倍。
“鑒于短語本身具有相同的文本,這些結(jié)果表明,ASR表現(xiàn)中的種族差異與和黑人講話者的發(fā)音和韻律差異有關(guān),包括節(jié)奏,音調(diào),音節(jié)重音,元音持續(xù)時(shí)間和韻律差異。”研究讀。
盡管男性和女性之間存在相似的差異,但非裔人男性的錯(cuò)誤率往往高于女性。對(duì)于大量使用非裔白話英語(AAVE)的演講者來說,準(zhǔn)確性是最差的。
當(dāng)然,機(jī)器學(xué)習(xí)系統(tǒng)不能像人們一樣受到偏見。但是,如果他們所訓(xùn)練的數(shù)據(jù)缺乏多樣性,那么它們的準(zhǔn)確性和性能將得到體現(xiàn)。該研究得出的結(jié)論是,主要問題似乎是在訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí)缺少來自黑揚(yáng)聲器的音頻數(shù)據(jù)。
值得注意的是,研究人員使用了這是一款利用Apple免費(fèi)語音識(shí)別技術(shù)定制設(shè)計(jì)的iOS應(yīng)用,尚不清楚Siri是否使用該精確的機(jī)器學(xué)習(xí)模型。該測(cè)試也在去年春季進(jìn)行,因此此后該模型可能已更改。
雖然研究專門針對(duì)黑白揚(yáng)聲器,但數(shù)字助理也很難理解其他口音?!度A盛頓郵報(bào)》
(The Washington Post) 在 2018年發(fā)表的一篇報(bào)道發(fā)現(xiàn),像Alexa或Google Assistant這樣的數(shù)字助理很難理解具有各種口音的人。通常,對(duì)大多數(shù)科技巨頭所在的西海岸的演講者最了解。
而且在2019年,聯(lián)邦研究人員還發(fā)現(xiàn)了種族偏見的廣泛證據(jù) 在將近200種面部識(shí)別算法中,缺乏數(shù)據(jù)集的多樣性會(huì)在所有類型的機(jī)器學(xué)習(xí)平臺(tái)中引起類似的問題。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。