谷歌AI檢測手語 準確度超九成

By on October 6, 2020

原文刊於信報財經新聞「StartupBeat創科鬥室

疫情下打工仔須遙距辦公,坊間的視像會議程式可根據現場收音,畫面自動切換至發言者;但對聾啞人士而言,使用手語便難以交流。有見及此,科技巨擘谷歌(Google)近日以人工智能(AI)技術,開發一個實時手語檢測模型,聲稱能結合視像會議程式,識別手語用戶的「發言」,準確度可達91.5%。

聾啞人士視像會議可「發言」

據研究團隊介紹,要在視像會議使用實時手語檢測模型,須事先運行另一個名為PoseNet的模型,以預測用戶身體及手部動作。系統會把畫面的人物動作簡化為「火柴人」般的肢體線條,並把實時影像的手語手勢,跟模型內的德國手語數據庫(DGS)比較。

當手語檢測模型偵測到使用手語時,模型會通過虛擬音頻線(virtual audio cable)生成及傳遞20kHz的音訊,該音訊超出人類聽覺範圍,但能被視像會議程式偵測,令程式知道手語用戶正在「發言」。研究團隊表示,實時手語檢測模型的準確度,有望進一步提升至91.5%。

Google的AI模型可識別使用手語時的「發言」。(Google圖片)

Google的AI模型可識別使用手語時的「發言」。(Google圖片)

開發團隊考慮到模型的實際情況,盡量只佔用小量CPU運算資源,降低對視像會議品質的影響。有關模型及網上演示的源代碼,已上傳至軟件代碼託管平台GitHub上,供網民下載及參考使用。

挪威大學鼓勵手寫強化學童記憶

此外,教育界近年積極推動電子學習,冀提高學生自主學習的能力,卻令執筆寫字機會大減。挪威科技大學的研究人員發現,比起在電腦或平板打字,學童以手腕寫字更能鞏固所學知識,提升學習效果;又呼籲學校在推行電子學習之餘,亦同樣需要正視手寫訓練。

科學網媒EurekAlert!報道,研究團隊曾對20名大學生、12名年輕成年人及12名兒童的大腦活動加以分析,為他們戴上由250多個電極組成的頭盔,透過腦電圖追蹤及觀察腦電波活動。結果發現,無論是成年人還是兒童,用手寫字時腦電波更為活躍。團隊解釋,用筆在紙上書寫,能夠刺激視覺、觸覺以至聽覺,有助強化大腦記憶。

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們