2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
如今,語音識別是智能手機包的標準部分,相應(yīng)的一部分是在等待Siri、Alexa或Google返回查詢時的延遲,要么正確解釋,要么嚴重損壞。谷歌最新的語音識別功能完全離線,完全消除了這種延遲——當然,糾纏仍然是一種選擇。
延遲的發(fā)生是因為你的聲音,或者從它導(dǎo)出的一些數(shù)據(jù),必須從你的手機到任何操作服務(wù)的人的服務(wù)器,在那里它被分析并在很短的時間后發(fā)送回來。這可以從一小撮毫秒到多個整秒的任何地方(真是個噩夢?。蛘吒L的時間,如果你的數(shù)據(jù)包在乙醚中丟失了。
為什么不只是在設(shè)備上進行語音識別呢?沒有什么比這些公司更想要的了,但是將語音轉(zhuǎn)換成毫秒級的文本需要相當大的計算能力。這不僅僅是聽到聲音和寫一個詞-理解一個人一字一句地說什么-涉及到關(guān)于語言和意圖的大量上下文。
你的手機可以做到,當然,但它不會比發(fā)送到云的速度快得多,它會耗盡你的電池。但這一領(lǐng)域的穩(wěn)步發(fā)展使得這樣做似乎有道理,谷歌的最新產(chǎn)品讓任何擁有Pixel的人都可以使用。
谷歌在這個話題上的工作,在這里的一篇論文中記錄了下來,它建立在以前的進步的基礎(chǔ)上,創(chuàng)建了一個小而高效的模型,足以適應(yīng)一部手機(如果你好奇的話,它是80兆),但能夠聽到和轉(zhuǎn)錄你說的話。不需要等到你完成了一個句子才去思考你的意思是“他們的”還是“那里的”-它在飛快地發(fā)現(xiàn)了這一點。
那有什么可抓的?嗯,它只在谷歌的鍵盤應(yīng)用Gboard中工作,它只在像素上工作,而且它只在美式英語中工作。所以在某種程度上,這只是對真實事物的一種壓力測試。
“鑒于這個行業(yè)的趨勢,隨著專業(yè)硬件和算法改進的融合,我們希望這里介紹的技術(shù)很快能夠以更多的語言和跨更廣泛的應(yīng)用領(lǐng)域采用,”谷歌寫道,仿佛這是需要做好本地化努力的趨勢。
使語音識別更具響應(yīng)性,并使其離線工作,是一個很好的發(fā)展。但考慮到谷歌的其他產(chǎn)品幾乎沒有離線工作,這有點好笑。當您脫機時,您是否要口述到共享文檔中?寫封郵件?求升與杯之間的換算??你需要一個連接!當然,這也會更好的緩慢和斑點的聯(lián)系,但你必須承認這是有點諷刺。
2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號:閩ICP備19027007號-6
本站除標明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。