您的位置: 首頁 >科技 >

這個(gè)開源的AI工具可以快速隔離任何歌曲中的人聲

2022-09-08 19:05:31 編輯:宣香棟 來源:
導(dǎo)讀 對于制作人,DJ以及任何想使用隔離音頻進(jìn)行演奏的人來說,將歌曲拆分為單獨(dú)的人聲和樂器一直是頭疼的問題。有很多方法可以執(zhí)行此操作,但是...

對于制作人,DJ以及任何想使用隔離音頻進(jìn)行演奏的人來說,將歌曲拆分為單獨(dú)的人聲和樂器一直是頭疼的問題。有很多方法可以執(zhí)行此操作,但是該過程可能很耗時(shí),并且結(jié)果通常不完美。新的開源AI工具使這項(xiàng)棘手的任務(wù)變得更快,更輕松。

該軟件稱為Spleeter,由音樂流媒體服務(wù)Deezer為研究目的而開發(fā)。昨天,該公司以開源軟件包的形式發(fā)布了該代碼,并將代碼放在Github上,供任何人下載和使用。只需向Spleeter提供一個(gè)音頻文件,它就會將Spleets分為兩個(gè),四個(gè)或五個(gè)獨(dú)立的音軌,稱為莖。結(jié)果并不完美,但是非常有用,Spleeter本身非常快。在專用GPU上運(yùn)行時(shí),它可以將音頻文件分成四個(gè)莖,比實(shí)時(shí)速度快100倍。

技術(shù)專家Andy Baio撰寫了一篇有關(guān)Spleeter的出色博客文章,其中包含許多自己的例子。Baio表示,該軟件產(chǎn)生的孤立人聲“有時(shí)會獲得機(jī)器人自動調(diào)整的感覺,但相對于其他解決方案,其出血量卻令人震驚地低。”

該工具似乎功能強(qiáng)大,但請注意:您需要一些技術(shù)知識才能使用它。除非您定期使用Python或Google的AI工具包TensorFlow(用于訓(xùn)練Spleeter)之類的軟件,否則必須下載一些程序才能啟動和運(yùn)行Spleeter。而且,您將不得不使用命令行輸入(盡管非常簡單)而不是更易于訪問的可視界面。

Deezer指出,這不是人們第一次使用機(jī)器學(xué)習(xí)來自動執(zhí)行此特定任務(wù),并且該公司已建立在許多早期研究的基礎(chǔ)上。Deezer的首席數(shù)據(jù)和研究官Aurelien Herault在通過電子郵件對The Verge講話時(shí)說,該公司在20,000種音樂曲目上使用各種類型的預(yù)分離人聲對其軟件進(jìn)行了培訓(xùn)。通過此信息,該軟件學(xué)習(xí)了如何隔離軌道本身。

總體而言,Spleeter是另一個(gè)出色的例子,說明了AI工具如何使復(fù)雜的創(chuàng)意工作變得更簡單。機(jī)器學(xué)習(xí)目前正用于自動執(zhí)行一系列耗時(shí)的任務(wù),從刪除圖片上的背景到升級舊視頻游戲中的紋理。從Adobe的Photoshop到Runway ML之類的新競爭者,這些工具越來越多地被并入消費(fèi)軟件。

Deezer說,它沒有計(jì)劃將Spleeter變成一個(gè)消費(fèi)工具,但是其他人可以承擔(dān)他們的工作,并在其上打一個(gè)簡單的界面。對于希望將孤立的人聲整合到混音中的DJ和制作人,或者對于希望創(chuàng)建自制卡拉OK伴奏音軌的人來說,顯而易見的應(yīng)用是它們。(根據(jù)最終產(chǎn)品的分發(fā)方式,此類活動可能不符合版權(quán)法。)

Deezer本身將Spleeter用于一系列研究應(yīng)用程序,以幫助改善其流媒體服務(wù)。“在內(nèi)部,我們將其用作預(yù)處理工具,以完成諸如音樂分類,轉(zhuǎn)錄和語言檢測之類的復(fù)雜研究任務(wù),” Herault說。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。