新華社「AI合成主播」幾可亂真 (凌通)

By on November 8, 2018

原文刊於《信報》的「凌通/中環解密」專欄

AI人工智能逐漸融入人類日常生活,昨日於浙江烏鎮揭幕的第5屆世界互聯網大會上,新華社與搜索引擎搜狗聯合發布全球首個「AI合成主播」,利用AI技術,複製出有讀稿能力且真假難辨的「真人主播分身」,期望可提升電視新聞的製作效率。

根據介紹,「AI合成主播」即日起上線,透過提取真人主播新聞播報影片中的聲音、唇形、表情動作等特徵,再運用語音、唇形、表情合成及深度學習等技術,聯合建模訓練而成。用戶只要輸入新聞文本,「主播」就能用跟真人一樣的聲音報道,與真人主播無異。

工作人員解釋,只要小量數據和時間,就能逼真地模擬人說話時的聲音、唇形和表情,甚至複製無數個風格各異的「AI合成主播」,滿足觀眾各種個性化需求,相信有助提高電視新聞的製作效率、減低成本,並在突發事件中快速製成新聞影片。

用戶只要輸入新聞文本,「主播」就能用跟真人一樣的聲音報道,與真人主播無異。(網上圖片)

用戶只要輸入新聞文本,「主播」就能用跟真人一樣的聲音報道,與真人主播無異。(網上圖片)

更多凌通文章:

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們