全新「聲納眼鏡」問世!無聲動動嘴就能播音樂,準確率高達95%
全新「聲納眼鏡」問世!無聲動動嘴就能播音樂,準確率高達95%

美國康奈爾大學的研究人員開發了一種新技術,可以通過聲納眼鏡進行無聲溝通。這種眼鏡利用微型揚聲器和麥克風來讀取佩戴者默念的單詞,從而可以在不需要實體輸入的情況下執行各種任務。

這項技術由康奈爾大學的博士生張瑞東(音譯)領導開發,是在一個類似的計畫基礎上進行的改進,該計畫使用了一個無線耳機,而之前的模型則依賴於鏡頭。

據瞭解,該聲納眼鏡使用一種名為EchoSpeech的無聲語音識別介面,利用聲納來感知嘴部運動,同時使用一個深度學習演算法即時分析回波特徵,這使得系統能夠以約95%的精準率識別佩戴者默念的單詞。

延伸閱讀:AI影像辨識大突破、減少醫療失誤⋯AI專家李飛飛:我們該如何理解AI?

這項技術最令人興奮的前景之一是,對於有語言障礙的人來說,可以使用它來無聲地將對話輸入到語音合成器中,然後將單詞大聲說出來。眼鏡也可以用來在安靜的圖書館中控制音樂播放,或者在嘈雜的音樂會上口述資訊。

錯誤率極低,聲納眼鏡可以做到哪些事?

該技術既小巧又低功耗,也不會侵犯隱私,因為沒有資料離開使用者的手機,這樣,就不會有隱私方面的擔憂。眼鏡佩戴非常方便,比其他可用的無聲語音識別技術更實用、更可行。

研究人員表示,該系統只需要幾分鐘的訓練資料來學習使用者的語音模式,學習完成後,就可以朝使用者的臉上傳送和接收聲波,感知嘴部運動,同時使用深度學習演算法分析回波特徵。該系統目前能夠識別31個孤立的命令和一串連續的數字,並且錯誤率低於10%。

該系統目前的版本提供了大約10小時的電池續航,並且可以通過藍牙無線地與使用者的智慧型手機通訊,智慧型手機負責處理和預測所有資料,並將結果傳輸到一些「動作鍵」,讓它可以播放音樂、與智慧裝置互動或啟動語音助手。

康奈爾大學智慧電腦介面未來互動(SciFi)實驗室正在利用康奈爾大學的一個資助計畫,來探索將這項技術商業化的可能性。

延伸閱讀:蘋果首款XR眼鏡「Reality Pro」要來了,估飆破3000美元!果粉真的想要嗎?

本文授權轉載自:T客邦

責任編輯:傅珮晴、蘇祐萱

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓