學者創AI文本分析量化輿情 挖掘投資訊息 洞悉金融先機

By on May 30, 2019

原文刊於信報財經新聞專欄「StartupBeat創科鬥室

數行者科技首席執行官龍毅(左)擅長數據挖掘及算法;另一創辦人張田余(右),則為中大商學院教授。(黃俊耀攝)

數行者科技首席執行官龍毅(左)擅長數據挖掘及算法;另一創辦人張田余(右),則為中大商學院教授。(黃俊耀攝)

人工智能(AI)的應用,在各行各業愈見普遍。其中在金融市場,本地初創「數行者科技」就以文本分析技術,開發中文內容分析系統,抽取及挖掘新聞報道和評論、公司公告、第三方分析師報告等非結構化資料(Unstructured Data),再轉為清晰易明的結構化金融訊息,助科研及金融機構掌握內地股壇動態。

涵蓋新聞評論公告報告

數行者科技有4名創辦人,其中張田余為中文大學商學院教授,研究範圍包括中國資本市場,以及文本分析等人工智能技術在金融市場的應用;身兼首席執行官(CEO)的另一名創辦人龍毅,曾於中大從事博士後(Postdoctoral)研究工作,擅長數據挖掘(Data Mining)和算法。

兩人接受訪問時表示,在互聯網和社交媒體世代,金融市場資訊泛濫,而且唾手可得,「但這些數據多以文字方式表達,所以我們想建立系統,以AI和大數據技術,把數據加以分析,將之變得結構化。」

龍毅提到,公司擬將服務拓至港股市場,但中港兩地用語大不同,將是挑戰。(黃俊耀攝)

龍毅提到,公司擬將服務拓至港股市場,但中港兩地用語將是挑戰。(黃俊耀攝)

他們開發的智能文本分析,將新聞報道、第三方分析報告、「股吧」等網上股票交流平台,甚或社交媒體等輿情作量化評分,分數介乎負1至1之間;分數愈高代表該些報道、報告或評論,對公司的評價愈正面,「我們的AI模型能避免簡單地,只靠『風險』、『損失』等負面詞,就將『新推出的服務可減少損失,降低風險』這一正面論述判斷為負面;亦不會錯誤地將『ABC公司將加深發展自主電池技術』,判斷文章和『深發展』(深圳發展銀行)相關。」

張田余強調,系統判斷內容是正面與否,是從投資者角度出發,故此「股價急挫」,一般都會被判別為負面內容,哪怕用戶本身是沽空機構,抑或涉事公司的競爭對手;「泰國發生洪水」的新聞未必會納入系統之中,但「泰國發生洪水導致電腦硬碟供應受影響」,由於涉及電腦行業則包括在內。

張田余強調,系統判斷內容是正面與否,是從投資者角度出發。(黃俊耀攝)

張田余強調,系統判斷內容是正面與否,是從投資者角度出發。(黃俊耀攝)

上市公司轇轕一目了然

此外,系統亦會為上市公司新聞抽取摘要,同時為內容分類事件(舉例:一篇有關新能源車輛被車廠召回的報道,會被歸類為「產品異常」),以便用戶快速掌握內容的要點。系統亦列出過去4星期有哪些相關文章,並計算出相似度分數,讓用戶掌握新聞的原創性,以及追蹤該事件的事態發展。

系統又設有A股公司輿情實時監控平台,列出過去24小時內最多新聞報道的內地A股公司,以及最負面(即輿情分數最低)新聞名單;至於公司高層社交關係圖譜,就展示不同公司之間千絲萬縷的關係,例如A、B兩間公司的高層,原來是上海交通大學的同學;C公司的高層在何年曾在D公司任職,或者公司之間的競爭、供應鏈關係等。

系統自2017年推出以來,已獲得清華大學、北京大學、上海交通大學等內地頂尖學府採購。去年亦拓展至金融機構市場,有多間內地大型券商試用服務。服務主要以應用程式介面(API)方式執行,可對接用戶自家交易系統。沒有對接自家交易系統的用戶(例如學術機構),則須自行登入系統獲取所需資訊。

目前系統僅覆蓋有關A股上市公司的新聞和訊息,新聞來源包括內地和本港媒體,「但關注A股市場的,始終是國內媒體多一點。」龍毅指出,系統是客觀的金融訊息工具,不會為用戶提供投資意見。

輿情實時監控平台,列出過去二十四小時內最多新聞報道的內地A股公司,以及最負面新聞名單。(黃俊耀攝)

輿情實時監控平台,列出過去二十四小時內最多新聞報道的內地A股公司,以及最負面新聞名單。(黃俊耀攝)

服務將延伸至港股

二人坦言,外國早有平台以文本分析技術,處理金融市場訊息;但內地卻缺乏一個中文內容分析系統,能針對中文資訊為主的A股市場,「中文相對難分析,因為有分詞的概念,就好像『能穿多少穿多少』這句話,其實可以有兩個意思,看你怎樣解讀。」

龍毅透露,公司正準備將服務延伸至港股市場,文字差異亦是箇中挑戰之一,「不是繁簡體字的問題,而是大家用語亦不同,例如香港慣用『看淡』,內地則用『看空』。」

至於公司的收入來源,則以用戶訂閱年費為主,收費按照企業客戶要求而定。二人表示,公司正致力尋找新客源,在早前舉行的「中大創業日」,亦接觸了一些潛在客戶及投資者。

雖然系統現時針對A股市場,但公司仍以香港作根據地,為服務延伸至港股做準備。龍毅看重香港具人才優勢:「雖然內地亦有很多人才,但從事AI、文本及數據分析的公司更多,爭奪人才的競爭因而更大。」

公司高管社交關係圖譜,展示不同公司之間千絲萬縷的關係。(黃俊耀攝)

公司高管社交關係圖譜,展示不同公司之間千絲萬縷的關係。(黃俊耀攝)

採訪、撰文:陳子健

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們