您的位置: 首頁 >互聯(lián)網(wǎng) >

谷歌的目標(biāo)是超過Prisma和細(xì)分與應(yīng)用程序增加多種風(fēng)格的視頻

2022-09-14 01:05:20 編輯:聞波璧 來源:
導(dǎo)讀 為了不被Prisma和Artisto這樣的應(yīng)用程序超越,谷歌今天公布了一項新研究,使應(yīng)用程序能夠在視頻上應(yīng)用一種藝術(shù)風(fēng)格,然后根據(jù)需要切換到不...

為了不被Prisma和Artisto這樣的應(yīng)用程序超越,谷歌今天公布了一項新研究,使應(yīng)用程序能夠在視頻上應(yīng)用一種藝術(shù)風(fēng)格,然后根據(jù)需要切換到不同的藝術(shù)風(fēng)格。這項工作涉及到一種被稱為深度學(xué)習(xí)的人工智能,它表明,谷歌希望在受到應(yīng)用程序的啟發(fā)后,提升這項技術(shù)的水平。這些應(yīng)用程序超越了你在Instagram上看到的那些簡單的照片過濾器。

該作品發(fā)布的前一天,F(xiàn)acebook演示了如何將樣式應(yīng)用到實時視頻中。

和Facebook的情況一樣,谷歌還沒有發(fā)布應(yīng)用程序,但這家搜索公司表示,它將很快開放代碼的源代碼,讓人們可以在谷歌的TensorFlow深度學(xué)習(xí)框架中試用這項技術(shù)。

為了做到這一點,谷歌正在將人工神經(jīng)網(wǎng)絡(luò)——深度學(xué)習(xí)的關(guān)鍵元素,在谷歌和其他公司越來越多的產(chǎn)品中使用——應(yīng)用到一種稱為風(fēng)格轉(zhuǎn)移的方法中。

“與以前方法快風(fēng)格轉(zhuǎn)移,我們認(rèn)為這種方法建模多個風(fēng)格同時打開車門激動人心的新方法為用戶與風(fēng)格傳輸算法,不僅允許自由創(chuàng)造新的風(fēng)格基于其他的混合物,但要做到實時,”谷歌高級研究科學(xué)家喬恩•Shlens谷歌軟件工程師的希Kudlur,和前谷歌大腦實習(xí)生文森特Dumoulin在一篇博客文章中寫道。

最初的實現(xiàn)非常緩慢。上傳一張照片——甚至不是一段視頻——你“仍然有足夠的時間在結(jié)果出來之前去喝杯咖啡,”Shlens, Kudlur和Dumoulin寫道。當(dāng)然,他們改進(jìn)了系統(tǒng)。

這項工作建立在去年走紅的谷歌的DeepDream系統(tǒng)之上。Prisma在今年確實經(jīng)歷了一場流行浪潮,而谷歌的新技術(shù)也可能會出現(xiàn)類似的情況——只要它能在相對較短的時間內(nèi)投入使用,同時Prisma的理念在人們的頭腦中仍然是新鮮的。

這可能會給谷歌帶來短期收益,但從長期來看,其影響可能更為顯著。三人在一篇論文中解釋道:

我們認(rèn)為,這是一個重要的問題,如果得到解決,將具有科學(xué)和實踐的重要性。首先,樣式轉(zhuǎn)移已經(jīng)在移動應(yīng)用程序中得到了應(yīng)用,對于移動應(yīng)用程序,設(shè)備上的處理取決于模型是否具有合理的內(nèi)存占用。更廣泛地說,為每一種風(fēng)格建立一個單獨的[網(wǎng)絡(luò)]忽視了這樣一個事實,即個別繪畫共享許多共同的視覺元素,而一個真正捕捉藝術(shù)風(fēng)格的模型將能夠利用和學(xué)習(xí)這種規(guī)律。此外,一個藝術(shù)風(fēng)格模型在繪畫風(fēng)格中推廣的程度,將直接衡量我們建立系統(tǒng)的能力,這些系統(tǒng)可以節(jié)省地捕捉照片和圖像的更高層次的特征和統(tǒng)計數(shù)據(jù)。Olshausen, 2001)。

請閱讀全文。

11月1日更新:谷歌現(xiàn)在已經(jīng)開源了為一個圖像添加多個樣式的代碼。它可以在GitHub上找到。為視頻添加多種樣式的代碼將在后面給出。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。