2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
如果您想知道下一部手機(jī)的攝像頭的性能如何,明智的做法是注意制造商對(duì)AI的評(píng)價(jià)。除了大肆宣傳之外,這項(xiàng)技術(shù)在過去幾年中還使攝影技術(shù)取得了驚人的進(jìn)步,沒有理由認(rèn)為進(jìn)展會(huì)放慢。
可以肯定,周圍還有很多頭。但是,最近攝影領(lǐng)域最令人印象深刻的進(jìn)步發(fā)生在軟件和芯片級(jí)別,而不是傳感器或鏡頭–這在很大程度上要?dú)w功于AI使相機(jī)更好地了解了他們所看的東西。
Google相冊(cè)清楚地展示了2015年該應(yīng)用程序啟動(dòng)時(shí)將AI和攝影相結(jié)合的強(qiáng)大功能。在此之前,搜索巨頭多年來一直在使用機(jī)器學(xué)習(xí)對(duì)Google+中的圖像進(jìn)行分類,但該公司推出了“照片”應(yīng)用程序包括大多數(shù)人難以想象的面向消費(fèi)者的AI功能。一夜之間,用戶雜亂無章的數(shù)千張未標(biāo)記照片庫被轉(zhuǎn)換成可搜索的數(shù)據(jù)庫。
突然之間,或看起來,Google知道您的貓是什么樣子。
Google建立了一個(gè)經(jīng)過深度訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò),以人類標(biāo)記的數(shù)據(jù)為基礎(chǔ),該研究是在2013年收購DNNresearch的先前工作的基礎(chǔ)上進(jìn)行的。這稱為監(jiān)督學(xué)習(xí);該過程涉及在數(shù)百萬張圖像上訓(xùn)練網(wǎng)絡(luò),以便它可以在像素級(jí)別尋找視覺線索以幫助識(shí)別類別。隨著時(shí)間的流逝,該算法在識(shí)別大熊貓方面變得越來越好,因?yàn)樗^去用來正確識(shí)別大熊貓的模式。例如,它可以了解黑色皮毛和白色皮毛之間的相互關(guān)系,以及與荷斯坦奶牛的皮有何不同。經(jīng)過進(jìn)一步的培訓(xùn),就有可能搜索更抽象的術(shù)語,例如“動(dòng)物”或“早餐”,這些術(shù)語可能沒有共同的視覺指標(biāo),但對(duì)于人類仍然是立即顯而易見的。
訓(xùn)練這樣的算法需要花費(fèi)大量時(shí)間和處理能力,但是在數(shù)據(jù)中心完成其工作后,就可以在低功率移動(dòng)設(shè)備上運(yùn)行而不會(huì)帶來太多麻煩。繁重的工作已經(jīng)完成,因此,一旦您的照片上傳到云中,Google便可以使用其模型來分析和標(biāo)記整個(gè)庫。Google Photos推出大約一年后,Apple宣布了照片搜索功能,該功能在神經(jīng)網(wǎng)絡(luò)上進(jìn)行了類似的訓(xùn)練,但是作為公司對(duì)隱私保護(hù)的承諾的一部分,實(shí)際分類是在每個(gè)設(shè)備的處理器上分別進(jìn)行的,而不發(fā)送數(shù)據(jù)。這通常需要一兩天,并且會(huì)在設(shè)置后的后臺(tái)發(fā)生。
智能照片管理軟件是一回事,但可以說,人工智能和機(jī)器學(xué)習(xí)首先會(huì)對(duì)圖像的捕獲產(chǎn)生更大的影響。是的,鏡頭繼續(xù)變得更快一點(diǎn),傳感器總是可以變得更大一點(diǎn),但是在將光學(xué)系統(tǒng)塞入超薄移動(dòng)設(shè)備中時(shí),我們已經(jīng)在推動(dòng)物理的局限性。盡管如此,如今至少在后期處理之前,手機(jī)在某些情況下要比許多專用攝像頭拍攝更好的照片并不罕見。這是因?yàn)閭鹘y(tǒng)相機(jī)無法在對(duì)攝影同樣重要的另一類硬件上競(jìng)爭(zhēng):包含CPU,圖像信號(hào)處理器以及神經(jīng)處理單元(NPU)的片上系統(tǒng)。
這就是所謂的計(jì)算攝影中使用的硬件,這個(gè)廣義的術(shù)語涵蓋了從手機(jī)人像模式中虛假的景深效果到有助于驅(qū)動(dòng)Google Pixel令人難以置信的圖像質(zhì)量的算法等所有內(nèi)容。并非所有的計(jì)算攝影都涉及AI,但AI無疑是AI的主要組成部分。
蘋果公司利用這項(xiàng)技術(shù)來驅(qū)動(dòng)其雙攝像頭手機(jī)的縱向模式。iPhone的圖像信號(hào)處理器使用機(jī)器學(xué)習(xí)技術(shù)通過一個(gè)攝像頭識(shí)別人,而第二個(gè)攝像頭創(chuàng)建一個(gè)深度圖,以幫助隔離對(duì)象并模糊背景。通過機(jī)器學(xué)習(xí)識(shí)別人的能力在2016年首次亮相時(shí)并不是什么新功能,因?yàn)檎掌M織軟件已經(jīng)在這樣做。但是以智能手機(jī)相機(jī)所需的速度實(shí)時(shí)管理它是一個(gè)突破。
Google仍然是該領(lǐng)域的明顯領(lǐng)導(dǎo)者,而三代Pixel所產(chǎn)生的出色結(jié)果是最令人信服的證據(jù)。HDR +是默認(rèn)的拍攝模式,它使用一種復(fù)雜的算法將幾張曝光不足的幀合并為一個(gè),就像Google的計(jì)算攝影負(fù)責(zé)人Marc Levoy在The Verge中指出的那樣,機(jī)器學(xué)習(xí)意味著系統(tǒng)只會(huì)隨著時(shí)間的推移而變得更好。Google已使用Google Photos軟件在龐大的帶有標(biāo)簽的照片數(shù)據(jù)集上訓(xùn)練了AI,這進(jìn)一步幫助了相機(jī)進(jìn)行曝光。像素2,特別是,生產(chǎn)這種基線圖像質(zhì)量的令人印象深刻的水平,有些我們?cè)谶吘壱呀?jīng)超過舒適的使用它的專業(yè)工作在這個(gè)網(wǎng)站上。
GOOGLE的NIGHT SIGHT是關(guān)于軟件在攝影中的作用的驚人廣告
但是Google的優(yōu)勢(shì)似乎從未像幾個(gè)月前推出Night Sight那樣明顯。全新的Pixel功能將長(zhǎng)時(shí)間曝光拼接在一起,并使用機(jī)器學(xué)習(xí)算法來計(jì)算更準(zhǔn)確的白平衡和色彩,并得出令人驚訝的結(jié)果。該功能在Pixel 3上效果最佳,因?yàn)樗惴ㄔO(shè)計(jì)時(shí)考慮了最新的硬件,但Google使其可用于所有Pixel手機(jī)-甚至包括缺乏光學(xué)圖像穩(wěn)定功能的原始手機(jī)-以及有關(guān)如何使用軟件的驚人廣告對(duì)于移動(dòng)攝影,現(xiàn)在比照相機(jī)硬件更重要。
話雖如此,硬件仍有空間發(fā)揮作用,特別是在有AI支持的情況下。Honor的新款View 20手機(jī)以及母公司華為的Nova 4,是首款使用Sony IMX586圖像傳感器的手機(jī)。它比大多數(shù)競(jìng)爭(zhēng)對(duì)手都更大的傳感器,其48兆像素代表了迄今為止在任何手機(jī)上所見的最高分辨率。但這仍然意味著將很多微小的像素塞滿一個(gè)很小的空間,這對(duì)于圖像質(zhì)量來說往往是有問題的。但是,在我的View 20測(cè)試中,Honor的“ AI Ultra Clarity”模式擅長(zhǎng)充分利用分辨率,對(duì)傳感器不尋常的濾色器進(jìn)行解密以解鎖更多細(xì)節(jié)。這會(huì)產(chǎn)生巨大的照片,您可以放大數(shù)天。
圖像信號(hào)處理器對(duì)于手機(jī)相機(jī)的性能一直很重要,但是隨著計(jì)算攝影技術(shù)的發(fā)展,NPU似乎將扮演更大的角色。華為是第一家發(fā)布具有專用AI硬件的芯片系統(tǒng)Kirin 970的公司,盡管蘋果的A11 Bionic最終獲得了消費(fèi)者的青睞。全球最大的Android處理器供應(yīng)商高通公司(Qualcomm)尚未將機(jī)器學(xué)習(xí)作為主要重點(diǎn),但谷歌已經(jīng)開發(fā)了自己的名為Pixel Visual Core的芯片來幫助完成與AI相關(guān)的成像任務(wù)。同時(shí),最新的Apple A12 Bionic具有八核神經(jīng)引擎,可以在Apple機(jī)器學(xué)習(xí)框架Core ML中運(yùn)行任務(wù),其速度比A11快9倍,并且首次將其直接鏈接到圖像處理器。蘋果表示,這可以使相機(jī)更好地了解焦平面,例如,有助于產(chǎn)生更真實(shí)的景深。
相機(jī)是任何手機(jī)的基本功能,而AI是我們改進(jìn)相機(jī)的最佳選擇
對(duì)于高效和高性能的設(shè)備上機(jī)器學(xué)習(xí)而言,這種硬件將變得越來越重要,就其對(duì)處理器的需求而言,它具有極高的上限。請(qǐng)記住,在將Google Photos設(shè)置為強(qiáng)大的功能之前,必須在具有強(qiáng)大GPU和張量核心的強(qiáng)大計(jì)算機(jī)上對(duì)其進(jìn)行訓(xùn)練,然后再將它們放到照片庫中??梢哉f,許多工作可以“提前”完成,但是在移動(dòng)設(shè)備上實(shí)時(shí)執(zhí)行機(jī)器學(xué)習(xí)計(jì)算的能力仍然是最前沿的。
Google展示了一些令人印象深刻的工作,它們可以減輕處理負(fù)擔(dān),而神經(jīng)引擎的速度每年都在提高。但是,即使在計(jì)算攝影的早期階段,從圍繞機(jī)器學(xué)習(xí)設(shè)計(jì)的手機(jī)攝像頭中也可以發(fā)現(xiàn)真正的好處。實(shí)際上,在過去幾年的AI炒作浪潮中提出的所有可能性和應(yīng)用中,當(dāng)今最實(shí)用的領(lǐng)域可以說是攝影。相機(jī)是任何手機(jī)的基本功能,而AI是我們改進(jìn)相機(jī)的最佳選擇。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。