2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ 備案號:
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)
您是否曾在網(wǎng)上閱讀并在您的網(wǎng)絡(luò)中共享它,但卻發(fā)現(xiàn)它是錯(cuò)誤的?作為一名軟件工程師和計(jì)算語言學(xué)家,她將大部分工作甚至休閑時(shí)間都花在電腦屏幕前,我很擔(dān)心我在網(wǎng)上看到的內(nèi)容。在社交媒體時(shí)代,我們許多人消費(fèi)不可靠的新聞來源。我們在社交網(wǎng)絡(luò)中接觸到大量信息 - 特別是如果我們花很多時(shí)間在Twitter和Facebook上掃描朋友的隨機(jī)帖子。
我和Simon Fraser大學(xué)話語處理實(shí)驗(yàn)室的同事們對假新聞的語言特征進(jìn)行了研究。
假新聞的影響
英國的一項(xiàng)研究發(fā)現(xiàn),大約三分之二的受訪成年人經(jīng)常在Facebook上閱讀新聞,而其中一半的人有過最初相信假新聞的經(jīng)歷。由麻省理工學(xué)院的研究人員進(jìn)行的另一項(xiàng)研究側(cè)重于接觸假新聞的認(rèn)知方面,并發(fā)現(xiàn),平均而言,新聞閱讀者至少有20%的時(shí)間認(rèn)為是虛假新聞標(biāo)題。
虛假故事的傳播速度比真實(shí)新聞快10倍,虛假新聞問題嚴(yán)重威脅著我們的社會。
例如,在2016年美國大選期間,數(shù)量驚人的美國公民相信并分享了一個(gè)明顯的虛假陰謀,聲稱希拉里克林頓與一家人工販賣集團(tuán)有關(guān)。餐館老板收到了死亡威脅,一名信徒帶著槍出現(xiàn)在餐廳。這個(gè) - 以及在選舉季節(jié)期間分發(fā)的其他一些假新聞報(bào)道 - 對人們的選票產(chǎn)生了不可否認(rèn)的影響。
在黨派團(tuán)體,社交媒體機(jī)器人和朋友的朋友分享了數(shù)千次之后,通常很難找到故事的起源。事實(shí)檢查網(wǎng)站,如Snopes和Buzzfeed只能解決一些最流行的謠言。
互聯(lián)網(wǎng)和社交媒體背后的技術(shù)使這種錯(cuò)誤信息得以傳播; 也許是時(shí)候問一下這項(xiàng)技術(shù)在解決這個(gè)問題時(shí)應(yīng)該提供什么。
贈品的寫作風(fēng)格
機(jī)器學(xué)習(xí)的最新進(jìn)展使得計(jì)算機(jī)能夠即時(shí)完成將人類花費(fèi)更長時(shí)間的任務(wù)。例如,有一些計(jì)算機(jī)程序可以幫助警方在幾秒鐘內(nèi)識別犯罪面孔。這種人工智能訓(xùn)練算法來分類,檢測和做出決策。
當(dāng)機(jī)器學(xué)習(xí)應(yīng)用于自然語言處理時(shí),可以構(gòu)建識別來自另一種類型的文本的文本分類系統(tǒng)。
在過去幾年中,自然語言處理科學(xué)家在構(gòu)建檢測錯(cuò)誤信息的算法方面變得更加積極; 這有助于我們了解假新聞的特點(diǎn),并開發(fā)技術(shù)來幫助讀者。
一種方法找到相關(guān)的信息來源,為每個(gè)來源分配可信度得分,然后將它們整合以確認(rèn)或揭穿給定的索賠。這種方法在很大程度上依賴于追蹤新聞的原始來源并根據(jù)各種因素評估其可信度。
第二種方法檢查新聞文章的寫作風(fēng)格而不是其起源。書面作品的語言特征可以告訴我們很多關(guān)于作者及其動機(jī)的信息。例如,與誠實(shí)書寫的相比,特定單詞和短語往往在欺騙性文本中更頻繁地出現(xiàn)。
發(fā)現(xiàn)假新聞
我們的研究使用機(jī)器學(xué)習(xí)和自然語言處理技術(shù)識別語言特征以檢測假新聞。我們對大量關(guān)于各種主題的事實(shí)檢查新聞文章的分析表明,平均而言,假新聞文章使用更多在仇恨言論中常見的表達(dá),以及與性,死亡和焦慮相關(guān)的詞語。另一方面,真實(shí)新聞包含更多與工作(商業(yè))和金錢(經(jīng)濟(jì))相關(guān)的詞匯。
這表明結(jié)合機(jī)器學(xué)習(xí)的風(fēng)格方法可能有助于檢測可疑新聞。
我們的假新聞檢測器是基于從大量新聞文章中提取的語言特征構(gòu)建的。它需要一段文字,并顯示它與以前見過的假新聞和真實(shí)新聞有多相似。(試試吧!)
然而,主要的挑戰(zhàn)是建立一個(gè)能夠處理各種新聞主題和在線標(biāo)題快速變化的系統(tǒng),因?yàn)橛?jì)算機(jī)算法從樣本中學(xué)習(xí),如果這些樣本不足以代表在線新聞,那么該模型的預(yù)測將是不可靠。
一種選擇是讓人類專家收集并標(biāo)記大量虛假和真實(shí)的新聞文章。該數(shù)據(jù)使機(jī)器學(xué)習(xí)算法能夠找到在每個(gè)集合中不斷發(fā)生的常見特征,而不管其他類型。最終,該算法將能夠在以前看不見的真實(shí)或假新聞文章之間區(qū)分。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ 備案號:
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請將#換成@)