輝達AI升級視像會議 慳九成頻寬

By on October 7, 2020

原文刊於信報財經新聞「StartupBeat創科鬥室

Nvidia Maxine是一款基於雲端的視像串流AI解決方案,用戶毋須安裝任何硬件設備,即可使用全新功能。(Nvidia網上圖片)

Nvidia Maxine是一款基於雲端的視像串流AI解決方案,用戶毋須安裝任何硬件設備,即可使用全新功能。(Nvidia網上圖片)

視像會議成為疫境下遙距辦公或上課的途徑,有人甚至斥巨資購入全套設備,務求提升視像通話質素。美國晶片商輝達(Nvidia)宣布推出新服務Nvidia Maxine,以人工智能(AI)技術,提升視像會議的畫面清晰度,並把所需頻寬勁減九成。

Nvidia網站介紹,Nvidia Maxine是一款基於雲端的視像串流AI解決方案,用戶毋須安裝任何硬件設備,即可使用全新功能。該技術主要透過AI,集中處理人物面部位置,比起一般要處理整個視像畫面,更有效把視像會議的頻寬,壓縮至標準大小的十分一,降低服務供應商成本之餘,用戶可用更少的數據,便能體驗更流暢的會議過程。

除了人面補光及虛擬背景,亦提供面部對齊功能,模擬雙方眼神接觸。(Nvidia網上圖片)

除人面補光及虛擬背景,亦提供面部對齊功能,模擬雙方眼神接觸。(Nvidia網上圖片)

此外,Nvidia Maxine透過雲端GPU加速運算,即使採用低階的網絡鏡頭,也能令模糊不清的串流影像,以較高解像度呈現。方案提供自動面部對齊及眼神校正功能,透過模擬眼神接觸,讓對話雙方恍如面談。其他功能包括人臉補光、虛擬背景、去除背景雜音,甚至用虛擬分身等。

實時翻譯 提供字幕

音訊處理方面,Nvidia Maxine所有工作均在雲端處理,並整合NVIDIA Jarvis技術,以AI語言模型構建虛擬助手,進行語音辨識、語言理解及語音生成。視像會議過程中,虛擬助手可抄寫筆記、實時翻譯、提供隱藏式字幕,甚至擬人聲線回答問題;即使與會者說不同的語言,亦能輕鬆理解交談內容。

不少視像會議程式,例如Zoom、 Skype、Microsoft Teams及Google Meet等,均具備部分Nvidia Maxine的功能,而新方案相信會促使其他對手,進一步改善自家技術。Nvidia Maxine最快於本周接受AI開發人員、視像會議服務商,以及軟件合作夥伴等申請

視像會議過程中,虛擬助手可抄寫筆記、實時翻譯、提供隱藏式字幕。(Nvidia網上圖片)

視像會議過程中,虛擬助手可抄寫筆記、實時翻譯、提供隱藏式字幕。(Nvidia網上圖片)

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們