2016-2022 All Rights Reserved.平安財經網.復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網 版權歸原作者所有。
谷歌母公司Alphabet旗下的DeepMind過去一年損失總額達5.72億美元。作為全球規(guī)模最大的人工智能學術研究機構之一,DeepMind在過去三年中始終虧損,累計金額已超10億美元。在未來12個月內,DeepMind還需要繼續(xù)投入超過10億美元。
這是否意味著AI技術正在走向崩潰?
這不一定。研究活動本來就相當燒錢,與一系列最頂尖的科學項目相比,DeepMind的支出只能算是“九牛一毛”。歐洲的大型強子對撞機項目每年光是維護成本就高達10億美元,最終發(fā)現希格斯玻色子的總成本估計將超過100億美元。而且,人們印象中的真正人工智能(也被稱為人工通用智能,簡稱AGI)這類既能玩轉《星際迷航》、又能聽懂人類表達的重量級成果,開出的價碼也絕對不會便宜。
即便如此,DeepMind逐年上升的虧損水平仍然值得關注:2016年,DeepMind虧損額為1.54億美元;2017年增長至3.41億美元;2018年則進一步提升至5.72億美元。在筆者看來,這其中包含著三大核心問題:
DeepMind是否找到了正確的科學探索方向?
從Alphabet的角度來看,這樣的投入規(guī)模是否合理?
如此可觀的虧損數字,又會給整個AI市場帶來怎樣的影響?
首先來看探索方向的問題。之所以值得討論,是因為DeepMind明顯是把雞蛋都放進了同一個籃子——也就是深度強化學習。這項技術主要用于通過模型識別將深度學習與強化學習加以結合,基于獎勵信號實現學習能力,從而使系統(tǒng)學會如何在游戲中獲得更高分數、或者在象棋等游戲中對抗求勝。
DeepMind的成名之作是2013年發(fā)表的一篇論文。這篇令人振奮的成果闡述了如何對單一神經網絡系統(tǒng)進行訓練,以教會其游玩多款雅達利游戲(包括〈突圍〉以及〈太空入侵者〉),并最終獲得近似甚至超越人類的成績。這篇論文讓DeepMind成了AI領域的搖滾巨星,并成功引起谷歌方面的注意。在2014年1月被谷歌收購之后,DeepMind進一步推動技術開發(fā),先后在圍棋以及不朽神作《星際爭霸》游戲中接連取得勝利。
但問題在于,這項技術對環(huán)境有著非常具體甚至可以說是苛刻的要求。例如在游玩《突圍》時,哪怕是一丁點微小的變化,例如將鏡頭對焦位置移動幾個像素點,其性能都會受到巨大影響。DeepMind的《星際爭霸》系統(tǒng)同樣局限性明顯:在同一地圖內使用同一種族進行對戰(zhàn),其成功確實足以超越人類;但在其它地圖使用另一種族時,成績就會快速下滑。要轉換作戰(zhàn)風格,我們必須從頭開始重新進行系統(tǒng)訓練。
從某種程度上講,深度強化學習是一種經過增強的記憶系統(tǒng);它在某些場景中確實擁有良好表現,但對工作內容的理解程度卻非常有限。因此,這類系統(tǒng)沒什么靈活性可言,無法即時根據環(huán)境變化做出調整,并最終導致極微小的變化都會顯著影響實際性能。(DeepMind最近公布的腎病檢查方案,也因為類似的問題而遭到質疑。)
深度強化學習同時需要大量數據作為支持——例如在學習圍棋時,需要完成數百萬盤自我對局才能掌握個人奧妙。很明顯,人類棋手不需要也不可能完成如此龐大的訓練量,而且這樣的過程難度極高且成本極巨,只有谷歌這樣的科技巨頭才能負擔得起恐怖的計算資源需求。換言之,絕大多數企業(yè)與客戶根本不可能在自己孱弱的獨立計算機上實現類似的現實問題解決能力。根據估算,AphaGo的整個訓練周期耗資達3500萬美元,其消耗的能量足以支持12760個人連續(xù)三天不停進行腦力勞動。
以上討論的只是經濟問題。更重要的是,正如Ernest Davis和筆者在即將出版的《Robboting AI》一書中提到,我們能否信任現有AI方案。目前,深度強化學習只能在良好可控的環(huán)境下提供可靠的結果;這樣的局限對于圍棋這種兩千年來沒怎么發(fā)生變化的場景非常適用,但我們顯然不敢貿然把它引入到其它現實問題當中。
>>> 難以實現商業(yè)應用
之所以難以商業(yè)應用,主要是因為目前大多數實際問題都不像游戲那樣擁有嚴格的場景與條件。也正因為如此,DeepMind目前仍拿不出比較像樣的深度強化學習商業(yè)方案。與此同時,Alphabet已經在DeepMind身上燒掉了約20億美元(包括2014年收購DeepMind的6.5億美元)。但除了賺到的好名聲之外,DeepMind在過去一年中只帶來了約1.25億美元的實際收入,其中相當一部分為Alphabet內部利用深度強化學習技術降低冷卻成本省下的電費。
而且在圍棋領域大顯身手的技能,也很難解決其它挑戰(zhàn)性問題——例如癌癥與清潔能源。這類狀況早已有之:IBM公司的Watson曾在問答節(jié)目當中一鳴驚人,但卻一直無法成功進軍醫(yī)學診斷領域。雖能夠在某些病例中提供良好表現,但Watson在另一些病例中卻慘遭失敗,甚至還曾經在心臟病發(fā)作癥狀的判斷上犯錯——要知道,這可是醫(yī)學新生都能準確判斷的病癥。
當然,時間也許能夠解決這個難題。至少自2013年以來,DeepMind就一直在努力研究深度強化學習技術,而且科技進步也向來難以快速轉化為實際產品。DeepMind以及其它研究機構,最終也許能夠找到一種可行的方式,促進深度強化學習帶來更穩(wěn)定也更契合任務內容的結果;又或者,這項技術未來能夠與其它技術結合起來,迸發(fā)出新的能量。也許深度強化學習最終能夠像當年的晶體管一樣,成為一種徹底改變世界的實驗室發(fā)明,也有可能永遠停留在探索階段,僅僅作為人類不斷探索真理的道路上的又一塊鋪路石。但無論如何,筆者個人猜測最終結果可能介于這兩者之間——有用而且廣泛存在,但又不足以改變整個世界。
雖然DeepMind目前的成果沒能完全符合人們的期待,相信也不會有人對其妄加指摘。深度強化學習不一定是通往人工通用智能的正確道路,但這絲毫不妨礙DeepMind自身的偉大——這仍是一個運營嚴密、資金充裕而且人才濟濟的機構。而且如果接下來AI的發(fā)展方向有所變化,DeepMind也一定會是能夠迅速抓住機會的參與者之一。就目前來看,能夠與DeepMind相抗衡的研究機構仍然屈指可數。與此同時,Alphabet也是一家財力雄厚的企業(yè),對他們來說一年5億美元也不是啥大問題。Alphabet公司曾非常英明地決定投資AI技術,其中包括目前同樣在快速成長的Google Brain項目。Alphabet方面可能會通過多種途徑調整自家AI方案的組合方式,不過考慮到這是一家年收入高達1000億美元的行業(yè)巨頭,而且旗下搜索服務及廣告推薦等大部分業(yè)務都依賴于AI技術,相信他們有能力也有理由繼續(xù)支持這些重量級研發(fā)項目。
>>> 過度炒作難題
關于最后一個問題,我們目前還很難判斷DeepMind的經濟狀況會給整個AI市場帶來怎樣的影響。如果交付的成果完全跟不上當初的炒作宣傳,那么“人工智能寒冬”也許終將來臨,甚至導致原本的支持者失去信心而停止投入。另外,如果DeepMind在未來幾年中的虧損額繼續(xù)一路飆升,恐怕Alphabet自己也有可能被迫退出。畢竟到目前為止,DeepMind還是拿不出像樣的財報數據,時間久了投資者難免要重新思考自己對于AI技術抱持的立場。
同樣麻煩纏身的,遠不只是DeepMind。無論是無人駕駛汽車還是能夠順暢理解人類語言的聊天機器人,這些幾年前被炒得火熱的概念至今仍然沒有實現。Mark Zuckerberg在2018年4月的國會聽證會上曾保證,虛假新聞問題很快就會在AI技術面前土崩瓦解。但是情況顯然沒這么簡單,這也使得整個社會對于AI技術的看法變得愈發(fā)保守——不信承諾,信“療效”。
至少就當下看,人工通用智能還只是個目標,距離真正落地還有很長的路。雖然AI技術在廣告及語音識別等一部分領域取得良好進展,但必須承認,AI發(fā)展還遠稱不上成熟。但在另一方面,我們也要認可AI在大數據分析領域的強大能力;而且哪怕只是當前的水平,AI也已經是一種卓越的技術工具。因此即使未來企業(yè)不再傾力投入,AI的研究與發(fā)展也絕對不會沉寂下去。
>>> 預測未來
在筆者看來,十年之后我們可能會得出結論,發(fā)現深度強化學習的意義其實被高估了。這也使得其它不少真正重要的研究方向遭到忽視。畢竟在強化學習領域投入的第一塊錢,都代表著其它研發(fā)經費的縮減——例如對于人類認知科學的研究。當下,很多機器學習研究人員都在問,“機器如何利用大量數據優(yōu)化復雜問題?”但我們真正應該關心的,其實是“為什么孩子們用不著那么多數據和那么復雜的處理流程,就能掌握自然語言并理解現實世界?”如果我們能在后一個問題上多花點時間、資金和精力,也許人工通用智能的來臨還能更早一些。
2016-2022 All Rights Reserved.平安財經網.復制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網 版權歸原作者所有。