您的位置: 首頁(yè) >互聯(lián)網(wǎng) >

在緊急情況下識(shí)別Twitter用戶(hù)位置的深度學(xué)習(xí)方法

2019-06-06 16:35:16 編輯: 來(lái)源:
導(dǎo)讀 印度國(guó)家技術(shù)研究所的研究人員最近設(shè)計(jì)了一種工具,用于識(shí)別緊急情況和災(zāi)害的地理位置,以及相關(guān)人員的地理位置。他們的方法在國(guó)際減災(zāi)風(fēng)險(xiǎn)

印度國(guó)家技術(shù)研究所的研究人員最近設(shè)計(jì)了一種工具,用于識(shí)別緊急情況和災(zāi)害的地理位置,以及相關(guān)人員的地理位置。他們的方法在國(guó)際減災(zāi)風(fēng)險(xiǎn)雜志的一篇論文中概述,使用基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的模型從推文中提取位置信息。

“在緊急情況下,事件的地理位置信息以及受影響的用戶(hù)的地理位置信息非常重要,”開(kāi)展這項(xiàng)研究的研究人員之一Jyoti Prakash Singh告訴TechXplore。“識(shí)別這個(gè)地理位置是一項(xiàng)具有挑戰(zhàn)性的任務(wù),因?yàn)榭捎玫奈恢米侄?,例如用?hù)位置和推文的地名不可靠。用戶(hù)的精確GPS位置在推文中很少見(jiàn),有時(shí)在時(shí)空信息方面也不正確。”

受自然災(zāi)害或其他緊急情況影響的人經(jīng)常在社交媒體上分享他們的位置,尋求幫助。這些信息可以幫助響應(yīng)單位和地方當(dāng)局及早發(fā)現(xiàn)事件,找到受害者并協(xié)助他們。但是,從推文中提取與位置相關(guān)的數(shù)據(jù)是一項(xiàng)非常具有挑戰(zhàn)性的任務(wù),因?yàn)檫@些數(shù)據(jù)通常是用非標(biāo)準(zhǔn)英語(yǔ)編寫(xiě)的,包含語(yǔ)法錯(cuò)誤,拼寫(xiě)錯(cuò)誤或縮寫(xiě)。

“人工操作員跟蹤推文幾乎不可能通過(guò)每條推文查找其中提到的位置信息,”辛格說(shuō)。“這促使我們開(kāi)發(fā)了一種解決方案,可以從推文中尋求幫助自動(dòng)提取位置信息。在這項(xiàng)工作中,我們利用深度學(xué)習(xí)來(lái)確定推文是否包含位置名稱(chēng)并突出顯示這些詞。”

Singh和他的同事Abhivan Kumar開(kāi)發(fā)了一個(gè)CNN 模型,可以通過(guò)分析他們推文的內(nèi)容來(lái)識(shí)別用戶(hù)的位置。他們選擇了這種特定的深度學(xué)習(xí)方法,因?yàn)樗梢宰詣?dòng)學(xué)習(xí)輸入數(shù)據(jù)的最佳表示,并使用它來(lái)識(shí)別位置參考。

“我們使用字嵌入技術(shù)在CNN的輸入層表示推文,并且推文中存在的位置參考以輸出層的形式呈現(xiàn)為零一向量,”Singh解釋說(shuō)。“位置字編碼為1,非位置字編碼為0.我們使用了2克,3克,4克和5克濾鏡的幾種組合來(lái)從推文中提取特征。對(duì)于100個(gè)時(shí)代的模型,它能夠以令人印象深刻的準(zhǔn)確度預(yù)測(cè)推文中提到的位置參考。“

在初步評(píng)估中,Singh和Kumar設(shè)計(jì)的CNN模型能夠以非常高的準(zhǔn)確度從推文中提取所有與位置相關(guān)的單詞,即使在推文的文本有噪聲時(shí)也是如此。研究人員在未經(jīng)預(yù)處理的推文上測(cè)試了他們的模型,其中包含語(yǔ)法錯(cuò)誤,拼寫(xiě)錯(cuò)誤,縮寫(xiě)和其他混淆因素。

“我們工作的主要實(shí)際意義在于它可以通過(guò)事件檢測(cè)模型輕松實(shí)現(xiàn)流水線(xiàn)化,”Singh說(shuō)。“事件檢測(cè)模型可以識(shí)別與所述災(zāi)難相關(guān)的推文,我們的模型可以提取受該災(zāi)難影響的受害者的位置。”

將來(lái),研究人員開(kāi)發(fā)的CNN模型可以幫助快速定位緊急事件和需要緊急援助的人。同樣的方法也可以應(yīng)用于內(nèi)亂,有針對(duì)性的廣告,觀察區(qū)域人類(lèi)行為,實(shí)時(shí)道路交通管理和其他基于位置的服務(wù)。

“在這項(xiàng)工作中,我們只考慮英語(yǔ)推文,但在危機(jī)期間,用戶(hù)也會(huì)發(fā)布地區(qū)語(yǔ)言的推文,”辛格說(shuō)。“因此,我們正在研究一種解決這種多語(yǔ)言限制的模型,同時(shí)還試圖開(kāi)發(fā)一種半監(jiān)督模型來(lái)減少數(shù)據(jù)標(biāo)記問(wèn)題。”


免責(zé)聲明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ   備案號(hào):

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。

郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)