這個開源的AI工具可以快速隔離任何歌曲中的人聲

2022-09-08 19:05:31 編輯：宣香棟來源：

導(dǎo)讀對于制作人，DJ以及任何想使用隔離音頻進(jìn)行演奏的人來說，將歌曲拆分為單獨(dú)的人聲和樂器一直是頭疼的問題。有很多方法可以執(zhí)行此操作，但是...

對于制作人，DJ以及任何想使用隔離音頻進(jìn)行演奏的人來說，將歌曲拆分為單獨(dú)的人聲和樂器一直是頭疼的問題。有很多方法可以執(zhí)行此操作，但是該過程可能很耗時，并且結(jié)果通常不完美。新的開源AI工具使這項(xiàng)棘手的任務(wù)變得更快，更輕松。

該軟件稱為Spleeter，由音樂流媒體服務(wù)Deezer為研究目的而開發(fā)。昨天，該公司以開源軟件包的形式發(fā)布了該代碼，并將代碼放在Github上，供任何人下載和使用。只需向Spleeter提供一個音頻文件，它就會將Spleets分為兩個，四個或五個獨(dú)立的音軌，稱為莖。結(jié)果并不完美，但是非常有用，Spleeter本身非?？?。在專用GPU上運(yùn)行時，它可以將音頻文件分成四個莖，比實(shí)時速度快100倍。

技術(shù)專家Andy Baio撰寫了一篇有關(guān)Spleeter的出色博客文章，其中包含許多自己的例子。Baio表示，該軟件產(chǎn)生的孤立人聲“有時會獲得機(jī)器人自動調(diào)整的感覺，但相對于其他解決方案，其出血量卻令人震驚地低。”

該工具似乎功能強(qiáng)大，但請注意：您需要一些技術(shù)知識才能使用它。除非您定期使用Python或Google的AI工具包TensorFlow(用于訓(xùn)練Spleeter)之類的軟件，否則必須下載一些程序才能啟動和運(yùn)行Spleeter。而且，您將不得不使用命令行輸入(盡管非常簡單)而不是更易于訪問的可視界面。

Deezer指出，這不是人們第一次使用機(jī)器學(xué)習(xí)來自動執(zhí)行此特定任務(wù)，并且該公司已建立在許多早期研究的基礎(chǔ)上。Deezer的首席數(shù)據(jù)和研究官Aurelien Herault在通過電子郵件對The Verge講話時說，該公司在20,000種音樂曲目上使用各種類型的預(yù)分離人聲對其軟件進(jìn)行了培訓(xùn)。通過此信息，該軟件學(xué)習(xí)了如何隔離軌道本身。

總體而言，Spleeter是另一個出色的例子，說明了AI工具如何使復(fù)雜的創(chuàng)意工作變得更簡單。機(jī)器學(xué)習(xí)目前正用于自動執(zhí)行一系列耗時的任務(wù)，從刪除圖片上的背景到升級舊視頻游戲中的紋理。從Adobe的Photoshop到Runway ML之類的新競爭者，這些工具越來越多地被并入消費(fèi)軟件。

Deezer說，它沒有計劃將Spleeter變成一個消費(fèi)工具，但是其他人可以承擔(dān)他們的工作，并在其上打一個簡單的界面。對于希望將孤立的人聲整合到混音中的DJ和制作人，或者對于希望創(chuàng)建自制卡拉OK伴奏音軌的人來說，顯而易見的應(yīng)用是它們。(根據(jù)最終產(chǎn)品的分發(fā)方式，此類活動可能不符合版權(quán)法。)

Deezer本身將Spleeter用于一系列研究應(yīng)用程序，以幫助改善其流媒體服務(wù)。“在內(nèi)部，我們將其用作預(yù)處理工具，以完成諸如音樂分類，轉(zhuǎn)錄和語言檢測之類的復(fù)雜研究任務(wù)，” Herault說。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請聯(lián)系刪除！