您的位置: 首頁 >互聯(lián)網(wǎng) >

引入神經(jīng)圖像評估來判斷照片

2019-06-21 16:47:11 編輯: 來源:
導(dǎo)讀 當(dāng)然,計算機軟件無法像我們一樣判斷圖片嗎?將數(shù)字分?jǐn)?shù)附加到技術(shù)細(xì)節(jié)是一回事,但我們不是用心和大腦來看待它們嗎?那么,當(dāng)Google研究人員

當(dāng)然,計算機軟件無法像我們一樣判斷圖片嗎?將數(shù)字分?jǐn)?shù)附加到技術(shù)細(xì)節(jié)是一回事,但我們不是用心和大腦來看待它們嗎?

那么,當(dāng)Google研究人員參與AI項目時,永遠(yuǎn)不要說永遠(yuǎn)。一個團(tuán)隊的目標(biāo)是有一種方法可以在評論家的椅子上評估照片。

在12月18日的Google研究博客上,軟件工程師Hossein Talebi和機器感知研究科學(xué)家Peyman Milanfar解釋了他們的方法如何更接近于猜測人類喜歡什么比以前的方法。

向神經(jīng)圖像評估(NIMA)系統(tǒng)問好,它可以在判斷照片時仔細(xì)復(fù)制人類的平均分?jǐn)?shù)。

“ 最近,用人類標(biāo)記數(shù)據(jù)訓(xùn)練的深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)已被用于解決特定類別圖像(如風(fēng)景)的圖像質(zhì)量的主觀性質(zhì)。然而,這些方法的范圍可能有限,因為它們通常將圖像分為兩類低質(zhì)量和高質(zhì)量。我們提出的方法可以預(yù)測評級的分布。“

他們的論文“NIMA:神經(jīng)圖像評估”在arXiv上發(fā)表。作者是Talebi和Milanfar。他們引入的深度CNN經(jīng)過培訓(xùn),可以預(yù)測典型用戶將哪些圖像評價為良好(技術(shù)上)或吸引人(美觀)。

博客調(diào)出了決定照片質(zhì)量的不同因素,從測量像素級降級到美學(xué)評估,捕捉與情感和美感緊密相關(guān)的語義級特征。

Engadget的 Jon Fingas 評論說:“如果谷歌有其自己的方式,人工智能可能會成為藝術(shù)評論家。”

畢竟,評級是基于它認(rèn)為你想要的,技術(shù)上和美學(xué)上的。

“目標(biāo)是獲得與人類感知相匹配的質(zhì)量得分,即使圖像被扭曲。谷歌已經(jīng)發(fā)現(xiàn)評估所給出的分?jǐn)?shù)與人類評估者給出的分?jǐn)?shù)相似,” The Quge的 Shannon Liao說。。

Fingas通過這個過程踩過讀者:

“它根據(jù)評級直方圖(例如來自照片競賽)的一組圖像進(jìn)行訓(xùn)練,這些圖像可以感知不同區(qū)域中圖片的整體質(zhì)量,而不僅僅是平均分?jǐn)?shù)或簡單的高/低評級。”

下一步是什么?

作者在博客中寫道,他們在NIMA上的工作建議基于機器學(xué)習(xí)的質(zhì)量評估模型可能具有有用的功能。

它們可以使用戶輕松找到最好的圖片; 或通過實時反饋實現(xiàn)改進(jìn)的拍照。

然而,他們說,“我們知道,在理解質(zhì)量和美學(xué)意味著什么方面做得更好的追求是一個持續(xù)的挑戰(zhàn) - 一個將涉及我們模型的持續(xù)再培訓(xùn)和測試。”

為什么這很重要:他們的工作不僅表明了一種與人類感知具有高度相關(guān)性的照片,而且還可以優(yōu)化照片編輯。

Fingas:“雖然還有很多工作要做,但有一天暗示你的手機可以像你一樣體驗照片的味道。”

廖:“有一天,公司希望人工智能能夠幫助用戶對最佳照片進(jìn)行分類,或者提供有關(guān)攝影的實時反饋。”


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。