香儂AI判別謠言突圍 分析公司新聞 衡量投資風險

By on July 30, 2019

原文刊於信報財經新聞「StartupBeat創科鬥室

來自9個地區的9支初企隊伍,須在48小時內就銷售、投資及風險管理的範疇,以AI技術提出解決方案(安聯投資圖片)

來自9個地區的9支初企隊伍,須在48小時內就銷售、投資及風險管理的範疇,以AI技術提出解決方案(安聯投資圖片)

人工智能(AI)愈趨普及,針對金融科技的應用更比比皆是。安聯投資(Allianz Global Investors)早前在港舉辦亞洲首個程式設計馬拉松,由香儂科技(Shannon.AI)以新聞分析脫穎而出,透過文本字句檢測謠言特徵,以識別指定公司的投資風險。

程式設計馬拉松9隊競逐

安聯投資邀請全球9間初創組隊來港競賽,隊伍須在48小時內就3個範疇,包括「銷售」、「投資」及「風險管理」等案例,運用AI技術提出解決方案。評判團就每個案例,選出一隊優勝隊伍,其方案將獲得採用。

來自北京的香儂科技,在「投資」案例組別獲勝。香儂科技數據科學家孟昱先指出,隊伍需要根據案例,找出影響公司債券孳息(Yield)的新聞或評論,他說:「我們需要從大會提供的債券孳息數據,以及對應時間段內所有關於指定公司的新聞中,提取可以訓練模型的數據,並讓模型學習這些新聞的特徵,用作未來預測。」

香儂科技算法工程師孫曉飛解釋,團隊在人工智能(AI)及自然語言處理(NLP)上,尤其機器學習及演算法均有深厚經驗,公司名字識別準確率非常高,有助「清洗」案例的「噪音」數據,避免墮入標籤含糊的陷阱,「以『力高集團』為例,文章出現『力高』二字,除了指該集團,也可能只是用了成語『法力高強』。」

孫曉飛(左一)表示,參賽模型只需稍加訓練,即可快速應用到新任務;旁為算法工程師馮鏡蓉(中)及數據科學家孟昱先 (右一)。(陳施敏攝)

孫曉飛(左一)表示,參賽模型只需稍加訓練,即可快速應用到新任務;旁為算法工程師馮鏡蓉(中)及數據科學家孟昱先 (右一)。(陳施敏攝)

孫曉飛又指出,香儂有不少已訓練好的模型產品,只需稍為調整,就可快速應用到新任務上,「如風險分類模型,它能夠在新聞之中,識別指定公司存在的投資風險,如債券、收益問題,以至公司高層的負面新聞等,共有40多種分類;這些正負面的分類,在比賽期間給予我們不少提示。」

機器學習比對事實揭造假

近年網絡充斥大量假新聞,能否有效篩選正確的資料,乃機器學習需要克服的難題。孟昱先提到,從機器學習角度而言,有不少能鑑別謠言的特徵,如網站和文章作者的權威性等,「我們會從已有的文本中抽取字句,並進行事實檢測。如文章中談及的所謂事實,與知識庫中的既定事實存在矛盾,便可簡單地檢測到文章的造假部分。」

孟昱先續稱,真假檢測是一個非常廣泛的領域,如有消息指某公司最近業績欠佳,其實當下難以判斷,只能繼續觀望;加上不同平台的謠言亦有不同風格,香儂更關心經濟學數據的事實檢測。

採訪、撰文:陳施敏

延伸閱讀:

南美初創籲勿誇大AI功能

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們