谷歌的目標是超過Prisma和細分與應用程序增加多種風格的視頻

2022-09-14 01:05:20 編輯：聞波璧來源：

導讀為了不被Prisma和Artisto這樣的應用程序超越，谷歌今天公布了一項新研究，使應用程序能夠在視頻上應用一種藝術風格，然后根據(jù)需要切換到不...

為了不被Prisma和Artisto這樣的應用程序超越，谷歌今天公布了一項新研究，使應用程序能夠在視頻上應用一種藝術風格，然后根據(jù)需要切換到不同的藝術風格。這項工作涉及到一種被稱為深度學習的人工智能，它表明，谷歌希望在受到應用程序的啟發(fā)后，提升這項技術的水平。這些應用程序超越了你在Instagram上看到的那些簡單的照片過濾器。

該作品發(fā)布的前一天，F(xiàn)acebook演示了如何將樣式應用到實時視頻中。

和Facebook的情況一樣，谷歌還沒有發(fā)布應用程序，但這家搜索公司表示，它將很快開放代碼的源代碼，讓人們可以在谷歌的TensorFlow深度學習框架中試用這項技術。

為了做到這一點，谷歌正在將人工神經(jīng)網(wǎng)絡——深度學習的關鍵元素，在谷歌和其他公司越來越多的產(chǎn)品中使用——應用到一種稱為風格轉移的方法中。

“與以前方法快風格轉移,我們認為這種方法建模多個風格同時打開車門激動人心的新方法為用戶與風格傳輸算法,不僅允許自由創(chuàng)造新的風格基于其他的混合物,但要做到實時,”谷歌高級研究科學家喬恩•Shlens谷歌軟件工程師的希Kudlur,和前谷歌大腦實習生文森特Dumoulin在一篇博客文章中寫道。

最初的實現(xiàn)非常緩慢。上傳一張照片——甚至不是一段視頻——你“仍然有足夠的時間在結果出來之前去喝杯咖啡，”Shlens, Kudlur和Dumoulin寫道。當然，他們改進了系統(tǒng)。

這項工作建立在去年走紅的谷歌的DeepDream系統(tǒng)之上。Prisma在今年確實經(jīng)歷了一場流行浪潮，而谷歌的新技術也可能會出現(xiàn)類似的情況——只要它能在相對較短的時間內投入使用，同時Prisma的理念在人們的頭腦中仍然是新鮮的。

這可能會給谷歌帶來短期收益，但從長期來看，其影響可能更為顯著。三人在一篇論文中解釋道:

我們認為，這是一個重要的問題，如果得到解決，將具有科學和實踐的重要性。首先，樣式轉移已經(jīng)在移動應用程序中得到了應用，對于移動應用程序，設備上的處理取決于模型是否具有合理的內存占用。更廣泛地說，為每一種風格建立一個單獨的[網(wǎng)絡]忽視了這樣一個事實，即個別繪畫共享許多共同的視覺元素，而一個真正捕捉藝術風格的模型將能夠利用和學習這種規(guī)律。此外，一個藝術風格模型在繪畫風格中推廣的程度，將直接衡量我們建立系統(tǒng)的能力，這些系統(tǒng)可以節(jié)省地捕捉照片和圖像的更高層次的特征和統(tǒng)計數(shù)據(jù)。Olshausen, 2001)。

請閱讀全文。

11月1日更新:谷歌現(xiàn)在已經(jīng)開源了為一個圖像添加多個樣式的代碼。它可以在GitHub上找到。為視頻添加多種樣式的代碼將在后面給出。

標簽：

免責聲明：本文由用戶上傳，如有侵權請聯(lián)系刪除！