2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
數(shù)據(jù)對(duì)于建立偉大的人工智能至關(guān)重要 - 在工業(yè)革命期間,該領(lǐng)域的研究人員將其與煤炭進(jìn)行了比較。擁有它的人將會(huì)前進(jìn)。那些沒有的人將被遺忘。在當(dāng)前的人工智能熱潮中,很明顯誰(shuí)擁有它:谷歌,F(xiàn)acebook和百度等科技巨頭。
這是令人擔(dān)憂的消息。畢竟,這些公司中的許多公司在搜索和社交媒體等領(lǐng)域幾乎都處于壟斷地位。他們的位置幫助他們收集數(shù)據(jù),這有助于他們建立更好的AI,這有助于他們保持領(lǐng)先于競(jìng)爭(zhēng)對(duì)手。對(duì)于公司本身而言,這是一個(gè)良性循環(huán),但如果沒有可行的競(jìng)爭(zhēng),公司可以 - 并且確實(shí) - 濫用其主導(dǎo)地位。
現(xiàn)在,來(lái)自Mozilla(Firefox瀏覽器的非營(yíng)利性創(chuàng)建者)的一個(gè)新項(xiàng)目正在試驗(yàn)數(shù)據(jù)壟斷的替代方案,要求用戶匯集信息以便為開源AI計(jì)劃提供支持。該公司的第一個(gè)項(xiàng)目名為Common Voice,Mozilla要求志愿者捐贈(zèng)聲音樣本,以建立一個(gè)開源語(yǔ)音識(shí)別系統(tǒng),如為Siri和Alexa提供支持。
Mozilla新興技術(shù)副總裁肖恩懷特告訴The Verge,“目前,控制語(yǔ)音識(shí)別的能力最終只能在少數(shù)人手中,我們不希望看到這一點(diǎn)。” 他說(shuō)要獲取數(shù)據(jù),大公司“只能過(guò)濾掉所有內(nèi)容”,但對(duì)于其他玩家來(lái)說(shuō),還需要其他方法。“對(duì)我們來(lái)說(shuō),有趣的問(wèn)題是,我們能做到這一點(diǎn),以便創(chuàng)建數(shù)據(jù)的人也受益嗎?”他問(wèn)道。
目前,Mozilla正在收集數(shù)據(jù),但計(jì)劃在今年年底之前提供開源語(yǔ)音識(shí)別功能。(它會(huì)進(jìn)入Firefox瀏覽器嗎?懷特不會(huì)說(shuō),但補(bǔ)充說(shuō):“我們已經(jīng)計(jì)劃了一些實(shí)驗(yàn)。”)目前,任何人都可以通過(guò)讀出來(lái)到Common Voice網(wǎng)站并“捐贈(zèng)”他們的聲音例句。他們還可以提供年齡,地點(diǎn),性別和口音等傳記信息。懷特說(shuō),這些信息將有助于Mozilla避免偏見創(chuàng)建其語(yǔ)音識(shí)別系統(tǒng),并確保該技術(shù)可以處理重音 - 谷歌和蘋果仍在努力解決這個(gè)問(wèn)題。
Privacy International的研究員Frederike Kaltheuner表示,這些公司經(jīng)常使用人工智能作為挖掘有價(jià)值的個(gè)人數(shù)據(jù)的“借口”,告訴用戶它將使他們能夠改善某些服務(wù)。她說(shuō),這可能是真的,但是為整個(gè)社會(huì)分享這些數(shù)據(jù)的后果不太清楚。“你們作為一個(gè)公民需要的東西與那個(gè)公司的利益之間存在著根本性的利益沖突,”Kaltheuner說(shuō)。
那么像Common Voice這樣的計(jì)劃如何引誘用戶遠(yuǎn)離現(xiàn)有的 - 并且無(wú)可否認(rèn)的方便 - 服務(wù)?畢竟,開源項(xiàng)目比互聯(lián)網(wǎng)存在的時(shí)間更長(zhǎng),但除少數(shù)例外,它們無(wú)法與商業(yè)產(chǎn)品競(jìng)爭(zhēng)。他們根本不提供類似的服務(wù)。
對(duì)于Mozilla來(lái)說(shuō),答案是個(gè)性化。畢竟,雖然針對(duì)人口規(guī)模的數(shù)據(jù)集進(jìn)行過(guò)培訓(xùn)的人工智能系統(tǒng)往往對(duì)普通人來(lái)說(shuō)足夠好,但在滿足較小群體或未在其數(shù)據(jù)中表示的群體的需求時(shí)往往會(huì)失敗。(通常情況下,數(shù)據(jù)偏向于白人男性,業(yè)界默認(rèn)。)
“為了讓我們?cè)跀?shù)據(jù)共享方面獲得成功,除了意識(shí)到有一天他們一直在泄露他們所有的個(gè)人數(shù)據(jù)之外,必須有一種動(dòng)機(jī)[對(duì)于用戶而言],”懷特說(shuō)。“我們必須讓他們的體驗(yàn)更好,因?yàn)樗麄円呀?jīng)參與。”在Common Voice的情況下,White想要盡可能多的重音數(shù)據(jù)來(lái)改善這些人的語(yǔ)音識(shí)別。“我們希望系統(tǒng)能夠更好地為您工作,因?yàn)槟囊恍?shù)據(jù)包含在內(nèi),”他說(shuō)。
提供個(gè)性化以換取數(shù)據(jù)是一個(gè)很好的主張,但對(duì)于那些打擊數(shù)據(jù)壟斷的人來(lái)說(shuō),它并不是一顆銀彈。首先,大公司可以向用戶提供他們自己的類似報(bào)價(jià)。(“Alexa不理解你?閱讀這個(gè)10分鐘的劇本,我們將改進(jìn)其語(yǔ)音識(shí)別。”)或者他們可以花錢來(lái)填補(bǔ)他們自己的數(shù)據(jù)集中的空白。例如,谷歌讓第三方公司向Redditors支付口音,以記錄他們自己的語(yǔ)音樣本。
White承認(rèn)Common Voice項(xiàng)目對(duì)許多這些問(wèn)題沒有答案,但Mozilla仍然致力于開放數(shù)據(jù)的核心原因。“這感覺就像一場(chǎng)真正的民主化活動(dòng),”他說(shuō)。并且有很多組織都有這種精神。有機(jī)器學(xué)習(xí)社區(qū)Kaggle,它有大量用戶貢獻(xiàn)的數(shù)據(jù)集供AI科學(xué)家使用; Elon Musk資助的OpenAI,開放其所有工作; 和Healthcare.ai,發(fā)布免費(fèi)使用的醫(yī)療算法。其中一些人在銷售他們自己的商業(yè)產(chǎn)品(如自動(dòng)駕駛汽車初創(chuàng)公司Comma.AI)時(shí)共同分享開源數(shù)據(jù)和研究。
盡管我們每天與之互動(dòng)的人工智能系統(tǒng)都建立在專有數(shù)據(jù)基礎(chǔ)之上,但是整個(gè)世界的研究人員和機(jī)構(gòu)都在發(fā)布有用的,如果是基本的開源替代方案。
然而,要將這些項(xiàng)目提升到新的水平,開源數(shù)據(jù)的支持者可能會(huì)擁有更高的權(quán)力來(lái)接管科技巨頭。深度學(xué)習(xí)公司Skymind的首席執(zhí)行官Chris Nicholson表示,“我們可能需要第三方介入 - 非政府組織,政府,小型私營(yíng)公司的聯(lián)盟 - 并匯總他們的數(shù)據(jù)。”Nicholson建議共享醫(yī)療保健數(shù)據(jù)可以改善醫(yī)療成像技術(shù)和駕駛員數(shù)據(jù)可以使自動(dòng)駕駛汽車在路上更加自然和直觀。他說(shuō),分享這些類型的數(shù)據(jù)集“具有明顯的公共利益。”
那么,捐出你的聲音可能只是一個(gè)開始。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。