您的位置: 首頁 >科技 >

谷歌的新語音識別系統(tǒng)可以即時離線工作

2020-01-04 11:05:41 編輯: 來源:
導(dǎo)讀 如今,語音識別是智能手機包的標準部分,相應(yīng)的一部分是在等待Siri、Alexa或Google返回查詢時的延遲,要么正確解釋,要么嚴重損壞。谷歌最新的語音識別功能完全離線,完全消除了這種

如今,語音識別是智能手機包的標準部分,相應(yīng)的一部分是在等待Siri、Alexa或Google返回查詢時的延遲,要么正確解釋,要么嚴重損壞。谷歌最新的語音識別功能完全離線,完全消除了這種延遲——當(dāng)然,糾纏仍然是一種選擇。

延遲的發(fā)生是因為你的聲音,或者從它導(dǎo)出的一些數(shù)據(jù),必須從你的手機到任何操作服務(wù)的人的服務(wù)器,在那里它被分析并在很短的時間后發(fā)送回來。這可以從一小撮毫秒到多個整秒的任何地方(真是個噩夢!),或者更長的時間,如果你的數(shù)據(jù)包在乙醚中丟失了。

為什么不只是在設(shè)備上進行語音識別呢?沒有什么比這些公司更想要的了,但是將語音轉(zhuǎn)換成毫秒級的文本需要相當(dāng)大的計算能力。這不僅僅是聽到聲音和寫一個詞-理解一個人一字一句地說什么-涉及到關(guān)于語言和意圖的大量上下文。

你的手機可以做到,當(dāng)然,但它不會比發(fā)送到云的速度快得多,它會耗盡你的電池。但這一領(lǐng)域的穩(wěn)步發(fā)展使得這樣做似乎有道理,谷歌的最新產(chǎn)品讓任何擁有Pixel的人都可以使用。

谷歌在這個話題上的工作,在這里的一篇論文中記錄了下來,它建立在以前的進步的基礎(chǔ)上,創(chuàng)建了一個小而高效的模型,足以適應(yīng)一部手機(如果你好奇的話,它是80兆),但能夠聽到和轉(zhuǎn)錄你說的話。不需要等到你完成了一個句子才去思考你的意思是“他們的”還是“那里的”-它在飛快地發(fā)現(xiàn)了這一點。

那有什么可抓的?嗯,它只在谷歌的鍵盤應(yīng)用Gboard中工作,它只在像素上工作,而且它只在美式英語中工作。所以在某種程度上,這只是對真實事物的一種壓力測試。

“鑒于這個行業(yè)的趨勢,隨著專業(yè)硬件和算法改進的融合,我們希望這里介紹的技術(shù)很快能夠以更多的語言和跨更廣泛的應(yīng)用領(lǐng)域采用,”谷歌寫道,仿佛這是需要做好本地化努力的趨勢。

使語音識別更具響應(yīng)性,并使其離線工作,是一個很好的發(fā)展。但考慮到谷歌的其他產(chǎn)品幾乎沒有離線工作,這有點好笑。當(dāng)您脫機時,您是否要口述到共享文檔中?寫封郵件?求升與杯之間的換算??你需要一個連接!當(dāng)然,這也會更好的緩慢和斑點的聯(lián)系,但你必須承認這是有點諷刺。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。