2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網(wǎng) 版權歸原作者所有。
從委內瑞拉的化妝師到保守地區(qū)的婦女,世界各地的人們都在做數(shù)字化的針線活,例如在街上的照片周圍的汽車上畫框,給圖像加標簽以及錄制計算機無法完全識別的語音片段。
這些數(shù)據(jù)直接輸入到“機器學習”算法中,該算法可幫助自動駕駛汽車繞過交通,讓Alexa知道您想要開燈。沒有大量的這種人類標記數(shù)據(jù),許多此類技術將無法工作。
這些重復的任務各得幾分錢。但是,從總體上講,這項工作可以在世界許多地方(甚至在)提供可觀的薪水。這種蓬勃發(fā)展但基本上看不見的家庭手工業(yè)代表了可以永遠改變人類的技術的基礎:人工智能將帶動我們到處走,執(zhí)行語言命令完美無缺,有一天可能會自己思考。
搜索引擎Google和Bing長期培育了這種人工輸入行業(yè),他們十多年來一直使用人們來評估結果的準確性。自2005年以來,亞馬遜的Mechanical Turk服務將自由職業(yè)者與臨時在線工作相匹配,還向全球研究人員提供了眾包數(shù)據(jù)輸入。
最近,投資者已經(jīng)向Mighty AI和CrowdFlower等初創(chuàng)公司投入了數(shù)千萬美元,這些初創(chuàng)公司正在開發(fā)軟件,即使在智能手機上,也可以更輕松地標記照片和其他數(shù)據(jù)。
CrowdFlower提供的這張未注明日期的圖像組合顯示了CrowdFlower的“環(huán)內人”技術渲染之前和之后的情況,該技術提供了先進的工具,使人們可以標記和構造普通照片的每個部分并將其轉換為結構化的“訓練數(shù)據(jù)” AI系統(tǒng)可以理解和解釋。(通過AP的CrowdFlower)
風險資本家S.“ Soma” Somasegar說,他在滿足機器學習算法需求方面看到了“數(shù)十億美元的機會”。他的公司Madrona Venture Group投資了Mighty AI。他說,人類將“長期,長期,長期地處于循環(huán)之中”。
準確的標簽可能會在區(qū)分天空和卡車側面的自動駕駛汽車之間有所區(qū)別。這是特斯拉的Model S在2016年首次已知的涉及自動駕駛系統(tǒng)的致命事故中失敗的標志。
Mighty AI首席執(zhí)行官Daryn Nakhuda說:“我們不是在構建游戲系統(tǒng),而是在構建拯救生命的系統(tǒng)。”
委內瑞拉馬拉開波市31歲的自由化妝師Marjorie Aguilar每天花費4至6個??小時在交通對象周圍繪制盒子,以幫助訓練Mighty AI的自動駕駛系統(tǒng)。
她的時薪約為50美分,但在一個通貨膨脹失控,危機重重的中,僅幾個小時的工作就可以支付玻利瓦爾一個月的房租。
她說:“這聽起來不算很多錢,但對我來說,這是相當不錯的。” “你可以想象對我來說用美元付款有多么重要。”
這張未注明日期的照片由馬喬里·阿吉拉爾(Marjorie Aguilar)提供,顯示了阿吉拉爾在委內瑞拉的馬拉開波。馬拉開波市的自由化妝師Aguilar每天花費四到六個小時在交通對象周圍繪制盒子,以幫助訓練Mighty AI的自動駕駛系統(tǒng)。(由馬喬里·阿吉拉爾(Marjorie Aguilar)通過AP提供)
阿里亞·赫里斯納(Aria Khrisna)是尼西亞Tegal的三歲兒子,今年36歲,他在諸如eBay和亞馬遜等網(wǎng)站的服裝圖片上添加文字標簽,每月付給他約100美元,大約是他收入的一半。
對于25歲的Shamima Khatoon來說,她在Metiabruz的數(shù)據(jù)標簽公司iMerit的全女性前哨站為汽車,車道標線和交通信號燈做注釋的工作,是她不得不在家外工作的唯一機會保守的穆斯林社區(qū)。
她說:“這是一個提高技能和養(yǎng)家的好平臺。”
豐田,日產(chǎn)和福特等主要汽車制造商,優(yōu)步(Uber)等打車公司以及Alphabet Inc.的Waymo等其他科技巨頭都在通過第三方供應商支付大量的標簽商。
更高準確性的好處可能是立竿見影的。
信息技術總監(jiān)Scot Whigham表示,在洲際酒店集團,其數(shù)字助理Amelia可以接聽的每個電話都可以節(jié)省5到10美元。
當Amelia失敗時,該程序在偵聽呼叫的同時將呼叫重新路由到大約60個服務臺工作人員之一。它從他們的反應中吸取教訓,并在下一個電話中試用該技術,從而使員工可以騰出時間做其他事情。
Whigham說:“我們已經(jīng)改變了這些工作。”
當計算機無法打出客戶致電凱悅酒店連鎖酒店的電話時,音頻片段就會發(fā)送到位于馬薩諸塞州富蘭克林的一座老式磚房中的AI呼叫中心Interactions。
在那里,當客戶等待電話時,一個戴著耳機的“意圖分析家”中的一員會抄錄從聽不見的數(shù)字到褻瀆行為的所有內容,并迅速指導計算機如何響應。
該信息將反饋到系統(tǒng)中。Interactions首席技術官Robert Nagle說:“下一次,我們有更大的機會獲得成功。”
研究人員試圖找到針對人類標記數(shù)據(jù)的解決方法,但結果通常不足。
在一個使用Google Street View停放的汽車圖像來估算社區(qū)人口構成的項目中,當時斯坦福大學的研究員Timnit Gebru嘗試通過刮擦Craigslist出售其所有者標記的汽車的照片來訓練自己的AI。
但是產(chǎn)品照片看起來與街景視圖中的汽車圖像完全不同,程序無法識別它們。她說,最后,她花了35,000美元聘請了汽車經(jīng)銷商專家來標記她的數(shù)據(jù)。
標簽技術公司CrowdFlower的首席執(zhí)行官Robin Bordoli說,對人類標簽的需求是“巨大的”和“動態(tài)的”。“您不能百分百相信算法。”
目前,弄清楚如何在沒有人類提供的所謂“地面真理”數(shù)據(jù)的情況下使計算機學習仍然是一個開放的研究問題。
加州大學伯克利分校的機器學習專家Trevor Darrell表示,他預計將需要5到10年的時間才能使計算機算法無需人工標記就能學會執(zhí)行。
僅他的小組每年就花費數(shù)十萬美元來支付人們對圖像進行注釋的費用。他說:“現(xiàn)在,如果您要銷售產(chǎn)品并且想要完美,那么不花錢在這種注釋上就太過疏忽了。”
像Alphabet的Waymo和游戲制造商Unity Technologies這樣的多家公司正在開發(fā)模擬世界,以在可預定義每個對象的受控場景中訓練其算法。
在大多數(shù)情況下,即使是試圖將人類趕出循環(huán)的公司也仍然依賴他們。
例如,CloudSight為網(wǎng)站和應用程序開發(fā)人員提供了一個方便的工具,用于上傳照片并返回一些描述它的單詞。零售商Kohl's使用該服務在其應用程序上實現(xiàn)“即點即買”視覺搜索功能。
但這不只是一個花哨的計算機程序,它會吐出響應。如果該算法沒有好的答案,那么它在,東南亞或非洲等地的800名員工之一會實時輸入答案。
“我們希望成為無需任何人參與即可標記任何圖像的標簽,” CloudSight業(yè)務開發(fā)負責人Ian Parnes說。“要花多長時間是所有人的猜測。”
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網(wǎng) 版權歸原作者所有。