您的位置: 首頁(yè) >科技 >

關(guān)于在機(jī)器學(xué)習(xí)期刊中解釋Hey Siri個(gè)性化

2022-06-27 18:51:01 編輯:支倫彪 來(lái)源:
導(dǎo)讀 在Apple的《機(jī)器學(xué)習(xí)期刊》上的新帖子中,該公司解釋了 Hey Siri語(yǔ)音激活功能背后的個(gè)性化工作原理,以減少誤報(bào)次數(shù)。該期刊指向較早

在Apple的《機(jī)器學(xué)習(xí)期刊》上的新帖子中,該公司解釋了“ Hey Siri”語(yǔ)音激活功能背后的個(gè)性化工作原理,以減少誤報(bào)次數(shù)。該期刊指向較早的條目,該條目描述了“ Hey Siri”檢測(cè)器的一般技術(shù)方法和實(shí)現(xiàn)細(xì)節(jié)以及更一般的,獨(dú)立于說(shuō)話者的“關(guān)鍵短語(yǔ)檢測(cè)”問(wèn)題,并以此作為基礎(chǔ)。最新論文重點(diǎn)介紹了蘋果公司在開發(fā)基本的說(shuō)話人識(shí)別系統(tǒng)中所采用的機(jī)器學(xué)習(xí)技術(shù),以減少附近其他人觸發(fā)的聽起來(lái)像“嘿Siri”的誤報(bào)的數(shù)量。

蘋果在2014年的iPhone 6首次亮相時(shí)推出了“嘿Siri”,盡管該功能最初需要將iPhone連接到電源。直到一年后iPhone 6s首次亮相,“永遠(yuǎn)在線的Hey Siri”才問(wèn)世,這要?dú)w功于新的低功耗協(xié)處理器,它可以提供連續(xù)的聆聽而不會(huì)消耗大量電池。同時(shí),該功能還通過(guò)添加新的“培訓(xùn)模式”在iOS 9中得到了進(jìn)一步改進(jìn),以幫助在初始設(shè)置過(guò)程中使Siri適應(yīng)特定iPhone用戶的聲音。

本文繼續(xù)說(shuō)明,“ Hey Siri”一詞最初被選擇為盡可能自然,并補(bǔ)充說(shuō),即使在引入該功能之前,Apple發(fā)現(xiàn)許多用戶在使用了“ Hey Siri”之后自然會(huì)以“ Hey Siri”開始他們的Siri請(qǐng)求。主頁(yè)按鈕將其激活。但是,該短語(yǔ)的“簡(jiǎn)潔明了”是一把雙刃劍,因?yàn)樗灿锌赡軐?dǎo)致更多的誤報(bào)。正如Apple解釋的那樣,早期的實(shí)驗(yàn)表明,意外激活的數(shù)量過(guò)多,與正確調(diào)用的“合理速率”不成比例。因此,Apple的目標(biāo)是利用機(jī)器學(xué)習(xí)技術(shù)來(lái)減少“錯(cuò)誤接受”的數(shù)量,以確保Siri僅在主要用戶說(shuō)“嘿Siri,

蘋果公司補(bǔ)充說(shuō),說(shuō)話者識(shí)別技術(shù)的“總體目標(biāo)”是通過(guò)語(yǔ)音確定一個(gè)人的身份,并提出了可能提供額外個(gè)性化甚至是身份驗(yàn)證的長(zhǎng)期計(jì)劃,尤其是考慮到蘋果HomePod等多用戶設(shè)備。目標(biāo)是確定“誰(shuí)在說(shuō)話”,而不是簡(jiǎn)單地說(shuō)出什么。本文繼續(xù)說(shuō)明“基于文本的說(shuō)話者識(shí)別”之間的區(qū)別,其中識(shí)別基于已知短語(yǔ)(例如“ Hey Siri”),以及“文本無(wú)關(guān)”的說(shuō)話人識(shí)別這一更具挑戰(zhàn)性的任務(wù),即識(shí)別用戶而不管他們說(shuō)什么。

也許最有趣的是,該期刊解釋了Siri如何繼續(xù)“隱式”訓(xùn)練自己以識(shí)別用戶的聲音,即使在明確的注冊(cè)過(guò)程(要求用戶在初始設(shè)置過(guò)程中說(shuō)出五個(gè)不同的“ Hey Siri”短語(yǔ))完成后也是如此。在初始設(shè)置之后,隱式過(guò)程將繼續(xù)對(duì)Siri進(jìn)行訓(xùn)練,方法是分析其他“ Hey Siri”請(qǐng)求并將其添加到用戶的個(gè)人資料中,直到總共存儲(chǔ)了40個(gè)樣本(稱為“揚(yáng)聲器矢量”)為止,其中包括原始的五個(gè)明確的培訓(xùn)過(guò)程。然后,使用此說(shuō)話人向量集合將其與將來(lái)的“ Hey Siri”請(qǐng)求進(jìn)行比較,以確定其有效性。蘋果還注意到,每個(gè)發(fā)聲波形的“ Hey Siri”部分也本地存儲(chǔ)在iPhone上,因此,每當(dāng)iOS更新中包含改進(jìn)的轉(zhuǎn)換時(shí),就可以使用這些存儲(chǔ)的波形來(lái)重建用戶配置文件。本文還提出了一個(gè)不需要明確的注冊(cè)步驟的未來(lái),并且用戶可以從空的配置文件中開始使用“ Hey Siri”功能,該功能會(huì)不斷增長(zhǎng)和更新。但是,目前看來(lái),顯式訓(xùn)練對(duì)于提供基線以確保以后的隱式訓(xùn)練的準(zhǔn)確性很有必要。

考慮到蘋果對(duì)隱私的態(tài)度,這并不奇怪,但仍然值得注意的是,所有這些計(jì)算和用戶語(yǔ)音配置文件的存儲(chǔ)僅發(fā)生在每個(gè)用戶的iPhone上,而不是在蘋果的任何服務(wù)器上進(jìn)行,這表明此類配置文件當(dāng)前未在設(shè)備。但是,隨著Apple改進(jìn)其演講者識(shí)別技術(shù),似乎合理的做法是,將來(lái)可以使用某些安全同步方法(例如iCloud鑰匙串)來(lái)同步此數(shù)據(jù),不僅跨iOS設(shè)備,而且還可以與諸如Apple HomePod之類的揚(yáng)聲器同步。 。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。