AI閱讀理解首超人類 微軟阿里模型冠同業

By on January 17, 2018

原文刊於信報財經新聞專欄「StartupBeat創科鬥室

人類在SQuAD閱讀理解測試錄得82.304分,但紀錄近日被AI改寫。(法新社資料圖片)

人類在SQuAD閱讀理解測試錄得82.304分,但紀錄近日被AI改寫。(法新社資料圖片)

繼Google旗下的AlphaGO去年擊敗中國圍棋高手柯潔後,人工智能(AI)近日再勝人類一仗。彭博報道,阿里巴巴及微軟所開發的AI模型上周均參與美國史丹福大學的閱讀理解測試,評分首次超越人類的最佳成績。

各國力爭做一哥

美國史丹福大學所建立的SQuAD數據集,被視為機器閱讀最權威的測量方法。做法是先從「維基百科」精選500多篇文章,再以人手梳理逾10萬條問題,然後讓AI系統理解回答,例如什麼原因導致下雨等。

根據最新測試結果,阿里巴巴的深度神經網絡模型以82.44分險勝人類的82.304分;微軟旗下的AI軟件更進一步,以82.65分刷新紀錄。報道指出,Facebook、騰訊(00700)及三星以往亦有提交有關AI模型,但成績不如阿里巴巴及微軟。

所謂「自然語言處理」(NLP)技術,就是以機器學習處理大量資訊,從而模仿人類對單詞及句子的理解,最常見於聊天機械人(chatbots),主要應用在客戶服務、博物館導賞、網上醫療查詢等層面,適合解讀書面數據,有望減省更多人手。不過,今次AI閱讀理解測試得分跑贏人類,並不代表它能透徹明瞭意思,只是詞彙識別較出色。

AI發展一日千里,威脅藍領工人的生計絕不是危言聳聽。事關各大生活層面,諸如倉庫搬運、操控自動駕駛車或協助農民種植等,都可找到其蹤影。俄羅斯總統普京去年9月聲言,誰能領導AI發展,就是未來世界的話事人。內地政府亦決心迎頭趕上,不惜向行業豪擲1500億美元(約1.17萬億港元),目標是2020年前主導市場。

AI在閱讀理解測試擊敗人類,但不代表它能真正理解意思。(路透資料圖片)

AI在閱讀理解測試擊敗人類,但不代表它能真正理解意思。(路透資料圖片)

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們