模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征使用人工智能豐富數(shù)字地圖

2022-07-19 16:43:21 編輯：水以嘉來源：

導(dǎo)讀最近小茹姐發(fā)現(xiàn)模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征使用人工智能豐富數(shù)字地圖這個話題相信很多小伙伴們都很感興趣吧,那么今天就帶大家了解...

最近小茹姐發(fā)現(xiàn)模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征使用人工智能豐富數(shù)字地圖這個話題相信很多小伙伴們都很感興趣吧,那么今天就帶大家了解下模型根據(jù)衛(wèi)星圖像標(biāo)記道路特征使用人工智能豐富數(shù)字地圖的具體詳情,那么小茹姐就來給大家說說具體的一些問題吧,希望對大家有所幫助。

麻省理工學(xué)院和卡塔爾計算機研究所(QCRI)的研究人員發(fā)明了一個模型，該模型使用衛(wèi)星圖像標(biāo)記數(shù)字地圖中的道路特征，可以幫助改善GPS導(dǎo)航。

向駕駛員顯示有關(guān)其路線的更多詳細(xì)信息通?？梢詭椭麄冊谀吧奈恢脤?dǎo)航。例如，車道計數(shù)可以使GPS系統(tǒng)警告駕駛員偏離或合并車道。合并有關(guān)停車位的信息可以幫助駕駛員提前計劃，而繪制自行車道則可以幫助騎自行車的人談判繁忙的城市街道。提供有關(guān)道路狀況的最新信息也可以改善救災(zāi)計劃。

但是，創(chuàng)建詳細(xì)的地圖是一項昂貴且耗時的過程，大部分由大型公司(例如Google)完成，這些公司通過綁在引擎蓋上的攝像頭向周圍的車輛發(fā)送車輛，以捕獲該地區(qū)道路的視頻和圖像。將其與其他數(shù)據(jù)結(jié)合可以創(chuàng)建準(zhǔn)確的最新地圖。但是，由于此過程很昂貴，因此世界上的某些地區(qū)被忽略了。

一種解決方案是在衛(wèi)星圖像上釋放機器學(xué)習(xí)模型(更易于定期獲取和更新)，以自動標(biāo)記道路特征。但是道路可能會被樹木和建筑物遮擋，這是一項艱巨的任務(wù)。麻省理工學(xué)院和QCRI研究人員在人工智能促進協(xié)會會議上發(fā)表的一篇論文中描述了“ RoadTagger”，它使用神經(jīng)網(wǎng)絡(luò)架構(gòu)的組合來自動預(yù)測后面的車道和道路類型(住宅或高速公路)的數(shù)量障礙物。

在對20個城市的數(shù)字地圖上被遮擋的道路上測試RoadTagger時，該模型對車道號的準(zhǔn)確度為77%，對推斷的道路類型的準(zhǔn)確度為93%。研究人員還計劃使RoadTagger能夠預(yù)測其他特征，例如停車位和自行車道。

“最新的數(shù)字地圖來自大公司最關(guān)心的地方。如果您在他們不太在意的地方，則在地圖質(zhì)量方面處于劣勢。”合著者，電機工程和計算機科學(xué)系(EECS)的教授Sam Madden說。以及計算機科學(xué)與人工智能實驗室(CSAIL)的研究員。“我們的目標(biāo)是使生成高質(zhì)量數(shù)字地圖的過程自動化，以便可以在任何/地區(qū)使用。”

結(jié)合CNN和GNN

Madden說，QCRI所在的卡塔爾“不是建造數(shù)字地圖的大公司的優(yōu)先事項”。然而，它正在不斷地建設(shè)新的道路，并改善舊的道路，尤其是為主辦2022年FIFA世界杯做準(zhǔn)備。

麥登說：“在訪問卡塔爾時，我們經(jīng)歷了Uber司機無法弄清楚自己要去哪里的經(jīng)歷，因為地圖太近了，” “如果導(dǎo)航應(yīng)用程序沒有正確的信息，那么對于諸如車道合并之類的事情，這可能會令人沮喪甚至更糟。”

RoadTagger依賴于通常用于圖像處理任務(wù)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)和圖神經(jīng)網(wǎng)絡(luò)(GNN)的新穎組合。GNN在圖中連接的節(jié)點之間建立模型關(guān)系，并已廣泛用于分析諸如社交網(wǎng)絡(luò)和分子動力學(xué)之類的事物。該模型是“端到端”的，這意味著它僅饋送原始數(shù)據(jù)并自動產(chǎn)生輸出，而無需人工干預(yù)。

CNN將目標(biāo)道路的原始衛(wèi)星圖像作為輸入。GNN將道路分為大約20米的路段，即“平鋪”。每個圖塊都是一個單獨的圖形節(jié)點，通過沿道路的線連接。對于每個節(jié)點，CNN都會提取道路特征，并與其直接鄰居共享該信息。道路信息會沿著整個圖形傳播，每個節(jié)點都會收到其他每個節(jié)點有關(guān)道路屬性的信息。如果圖像中遮擋了某個圖塊，RoadTagger將使用道路上所有圖塊的信息來預(yù)測遮擋的背后。

研究人員說，這種組合架構(gòu)代表了更像人類的直覺。假設(shè)四車道的道路的一部分被樹木遮擋，因此某些圖塊僅顯示兩條車道。人們可以輕易地推測出樹木背后隱藏著兩條車道。傳統(tǒng)的機器學(xué)習(xí)模型(例如CNN)僅提取單個圖塊的特征，最有可能預(yù)測被遮擋的圖塊是一條兩條車道。

他說：“人類可以使用相鄰圖塊中的信息來猜測被遮擋的圖塊中的車道數(shù)量，但是網(wǎng)絡(luò)無法做到這一點。” “我們的方法試圖模仿人類的自然行為，我們從CNN捕獲本地信息，從GNN捕獲全球信息，以做出更好的預(yù)測。”

學(xué)習(xí)權(quán)重

為了訓(xùn)練和測試RoadTagger，研究人員使用了稱為OpenStreetMap的真實世界地圖數(shù)據(jù)集，該數(shù)據(jù)集使用戶可以編輯和管理全球數(shù)字地圖。他們從該數(shù)據(jù)集中，從包括波士頓，芝加哥，華盛頓和西雅圖在內(nèi)的20個城市的688平方公里地圖上收集了已確認(rèn)的道路屬性。然后，他們從Google Maps數(shù)據(jù)集中收集了相應(yīng)的衛(wèi)星圖像。

在培訓(xùn)中，RoadTagger學(xué)習(xí)了CNN和GNN的權(quán)重-這些權(quán)重為特征和節(jié)點連接分配了不同程度的重要性。CNN從圖塊的像素圖案中提取特征，而GNN沿圖傳播學(xué)習(xí)的特征。從道路的隨機選擇子圖中，系統(tǒng)學(xué)習(xí)預(yù)測每個圖塊的道路特征。這樣，它會自動了解哪些圖像特征有用，以及如何沿圖傳播這些特征。例如，如果目標(biāo)圖塊具有不清晰的車道標(biāo)記，但是其相鄰圖塊具有四個具有清晰車道標(biāo)記的車道，并且共享相同的道路寬度，則目標(biāo)圖塊很可能也具有四個車道。在這種情況下，模型會自動獲悉道路寬度是有用的圖像特征，因此，如果兩個相鄰的圖塊共享相同的道路寬度，

給定OpenStreetMap訓(xùn)練中未見的道路，該模型將道路分解為小塊，并使用其學(xué)習(xí)的權(quán)重進行預(yù)測。該模型的任務(wù)是預(yù)測被遮擋的圖塊中的車道數(shù)量，該模型指出相鄰圖塊具有匹配的像素模式，因此共享信息的可能性很高。因此，如果這些圖塊具有四個車道，則被遮擋的圖塊也必須具有四個車道。

在另一個結(jié)果中，RoadTagger在合成的，極具挑戰(zhàn)性的道路中斷數(shù)據(jù)集中準(zhǔn)確預(yù)測了車道號。作為一個示例，具有兩個車道的立交橋覆蓋了具有四個車道的目標(biāo)道路的幾塊瓷磚。該模型檢測到立交橋的像素模式不匹配，因此它忽略了覆蓋圖塊上的兩條車道，準(zhǔn)確地預(yù)測了下面的四個車道。

研究人員希望使用RoadTagger來幫助人們快速驗證并批準(zhǔn)對數(shù)據(jù)集(如OpenStreetMap)中基礎(chǔ)結(jié)構(gòu)的持續(xù)修改，其中許多地圖都不包含車道數(shù)或其他詳細(xì)信息。Bastani說，一個特別感興趣的地區(qū)是泰國，那里的道路在不斷變化，但是數(shù)據(jù)集中幾乎沒有更新。

“曾經(jīng)被標(biāo)記為土路的道路已經(jīng)鋪好，所以最好繼續(xù)行駛，并且一些交叉路口已經(jīng)完全建成。每年都有變化，但是數(shù)字地圖已經(jīng)過時了。”他說。“我們希望根據(jù)最新圖像不斷更新此類道路屬性。”

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請聯(lián)系刪除！