Don't Miss

自家技術冀創造神級秘書

By on May 4, 2020

原文刊於信報財經新聞「StartupBeat創科鬥室

梁松預言,用戶未來可透過語音發問,讓Otter找出以往所有相關會議對話的內容重點。(Twitter圖片)

梁松預言,用戶未來可透過語音發問,讓Otter找出以往所有相關會議對話的內容重點。(Twitter圖片)

語音辨識技術近年快速提升,多個虛擬語音助理(virtual assistant)相繼湧現。Otter.ai行政總裁兼聯合創始人梁松指出,其語音轉字軟件Otter所採用的技術,跟蘋果Siri、亞馬遜Alexa、Google Assistant、微軟Cortana等語音助理不同,因為語音助理「不是為會議對話而設計的,你在使用時要說『Hey Alexa』之類字句來喚醒系統,然後問一條簡短問題。過程中,通常只有一個人在說話,這不是人與人之間的正常對話方式。我們做的是人與人對話,他們做人與機械對話,當中涉及的技術截然不同。」

由於目標及焦點不同,Otter.ai並不依賴科技巨擘的AI技術開發,而是從頭建立自家技術架構,並用大量會議及對話數據訓練AI演算法。

與語音助理分別大

與Otter.ai不同,谷歌用來訓練其語音助理的大部分資料,旨在為了訓練其「人類與機械之間的對話」而準備。梁松表示,訓練資料與開發目標的不同,自然帶來技術成果與功能上的差異,「對電腦系統來說,如何可靠地辨識不同發言者的聲音,仍然是一個尖端、前沿的研究主題。當你真正針對問題作出解決,即使一個小公司團隊,也足可以打敗科技龍頭。」

Otter.ai 從頭建立其技術架構,並用大量會議對話數據,以訓練其AI演算法。(Otter.ai網上圖片)

Otter.ai 從頭建立其技術架構,並用大量會議對話數據,以訓練其AI演算法。(Otter.ai網上圖片)

梁松透露,Otter.ai團隊已着手探索支援影片對話內容的技術,「通過影片,我們的系統可以讀取影片對話的人類表情,以及影片出現的圖像及文字內容,進一步理解對話內容。」

儘管目前業務集中於口述自動筆錄,Otter.ai的願景並不止於建立成功的辦公協作軟體,「口述自動筆錄是非常重要的第一步,這實際上更涉及到AI對人類在對話、問答當中的邏輯與推理,進行更深層次的理解;讓電腦系統識別人類對話的問題和答案,並將兩者正確配對,已是另一層次與難度的技術。」

梁松預言Otter未來或成為每個人的私人秘書,「一個擁有無限記憶力與資料的秘書」。用戶可透過語音發問,讓Otter找出以往所有相關會議對話的內容重點,「進行搜索及檢視、找出答案和重點,這是我們看到Otter未來可以發展的領域。」

延伸閱讀:

Otter會議速記AI辨聲摘重點 橋水IBM採用 擬拓日語中文領域

支持 StartupBeat

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們