You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

聲納眼鏡識別嘴型收無聲指令

By on April 12, 2023

原文刊於信報財經新聞「StartupBeat創科鬥室

身處安靜的圖書館,不方便與人高聲交談或使用手機語音指令。美國康奈爾大學團隊近日研發一款聲納眼鏡EchoSpeech,透過聲波傳感及人工智能(AI)技術,能夠識別用戶的嘴型,藉此對應31條靜音指令,包括解鎖手機、播放音樂,以至操控CAD設計軟件等,聲稱準確率高達95%。

示範影片可見,EchoSpeech外觀與一般平光眼鏡相似,但在左右鏡框底部,分別安裝了喇叭及收音咪。喇叭會發出人耳聽不到的聲波,聲波經用戶的嘴部動作反射,並由收音咪接收;經藍牙實時傳送至智能手機後,再由團隊開發的深度學習演算法分析。

聲納眼鏡框底部安裝了喇叭及收音咪,以演算法分析嘴部動作。(網上圖片)

聲稱95%準確 續航10小時

聲納眼鏡用法簡單,用戶只須數分鐘,便能掌握。演算法會把特定聲波,與指令的嘴型互相關聯,例如暫停/播放音樂、上/下一首歌曲、降低/提高音量,以至解鎖手機、數字組合等。聲納眼鏡現時能辨識31個相關指令,聲稱準確度約95%。此外,聲納眼鏡亦可與觸控筆連接,配合CAD等設計軟件一併使用,幾乎毋須用到鍵盤或滑鼠。

研發團隊稱,聲納眼鏡不設鏡頭,且所有數據均在手機處理,不會上傳至雲端,減低私隱外洩風險;加上採用聲波傳感技術,電池續航力達10小時。此外,語言障礙人士可透過聲納眼鏡,無聲地把指令輸入語音合成器,再由合成器大聲說話。團隊正研究商業化相關技術,並探索更多眼鏡相關應用,例如追蹤臉部、眼睛及上半身的動作等。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們