Google語音AI分拆人聲減雜音

By on April 17, 2018

原文刊於信報財經新聞專欄「StartupBeat創科鬥室

在雞尾酒會等社交場合聽演講,嘈雜環境往往分散人們的注意力。Google旗下語音識別系統近日有新突破,團隊首先上傳10萬部演講影音內容,訓練人工智能(AI)模型辨識視聽訊號(如人聲嘴形是否同步),再把不同音源的人聲拆解出來。

該技術除了可降低雜音,更可增強主要人聲,甚至自動生成字幕,適合YouTube等短片平台使用。(網上圖片)

0417_P08

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們