中大工商管理學院副教授陳偉光 人工智能幫少數族裔學好中文

By on January 25, 2019

本文作者張綺霞,為《信報》撰寫專欄「訪談錄」。

中文大學工商管理學院副教授陳偉光研究人工智能多年,希望能幫助更多人。(吳楚勤攝)

中文大學工商管理學院副教授陳偉光研究人工智能多年。(吳楚勤攝)

少數族裔學中文難,是多年來無法解決的問題。香港中文大學工商管理學院副教授陳偉光從事人工智能研究多年,專攻運算語言學,在朋友偶然的提醒下,發現自己這套工具也能應用於語言學習上,遂與團隊將研究成果轉化,成為專為非華語母語學生而設的網上字典,將中文文句自動拆解成字詞,逐個分析,教導其筆順部首等,目前已開始在學校應用。

雖然是商學院教授,但他笑言,不是每件事都需要講錢。無論賺不賺錢,研究都是為了幫助其他人過得更好。「這個網站不能取代真正的老師,我也不是要做教育家,誰有技術就去做吧。最重要是有人能從中得益。」

陳偉光從事人工智能研究多年,專門從事漢語分析。漢語的字詞組合變化大,「如何將漢語句子分拆,是一個複雜的問題。」研究多年,他發展出分析工具「HanMosaic」,能將漢字字句及段落分拆,分辨出哪些是詞語,哪些是單字。常人以為這需要龐大的資料庫協助,但原來不需要整本字典都輸入電腦,只需要有一個能自行學習的人工智能,就如之前戰勝多個世界冠軍的圍棋程式AlphaGo一樣。

「HM Learn」網站能把句子自動拆解成詞語,每個字詞都有詳細註解方便學習。(網頁截圖)

「HM Learn」網站能把句子自動拆解成詞語,每個字詞都有詳細註解方便學習。(網頁截圖)

「小孩子要學好語文,只需要叫他們多看書,看得多自然學好。我要做的只是要訓練這個人工智能,給它很多文章,教它自己去看,即定下一些規則讓它自己分析,再糾正它錯誤的結果。我們沒有死的規則,也沒有人手去輸入太多資料,只是給它從網上自行學習。」

這套能準確分拆字詞的工具發明以後,在商業上也有不少應用,例如將字詞歸類成不同的情緒作情緒分析。他曾以這工具大量分析財經評論,總結其中的情緒導向,預測對讀者心情和股票市場的影響,或者幫助公司分析客戶電郵的心情,再劃分緩急次序處理等。兩年前,有朋友了解他的研究後,建議他這套軟件不只可作商業用途,更可幫助其他人。

這位朋友經常做義工幫助少數族裔小朋友,感嘆他們學中文很困難,學校課程未能完善,就算聽和講可以如華裔小朋友一樣,但在讀寫上始終落後一大截,最後因為語言能力而錯失很多工作機會。於是想到,他這套工具也可幫助不熟悉中文的孩子拆解句子,更有效地學習。

暫以英語人士為對象

於是陳偉光申請基金資助,聘請團隊研發出一個網上字典「HM Learn」。這字典結合網上翻譯軟件、發音工具、圖片、電子辭典等不同資源,只要在上面打進或貼上任何字句,電腦系統便立刻將句子分拆成單詞,解釋個別詞語的意思,聆聽廣東話發音等。「對於不懂中文的人來說,最困難的是不知道哪個字跟哪個字是一個詞,對他們來說只是看到一串字。」

這字典專為不懂中文的外語學生而設,按進每一個字,都能個別了解其意思,又能看這個字的書寫筆順,以及跟其他字組合成的詞語等。「更可以跟着筆順練習寫字,寫不正確,電腦就會提醒你。」學生更可按下「split」(分拆)按鈕,了解其部首如何從其他部分分拆,觀看部首的圖像意思,了解這個部首還能組成什麼字。他表示,整個分析是一層層分拆,從句子、詞彙、單字、部首、筆順等,希望能幫小朋友更容易地學習中文。「我們只是把所有東西整合在一起成一個平台,這樣就不用這邊找那邊找,更快地幫他們理解一句話。」

這個網站更能支援圖像上載,放上圖像,就能自動估測或翻譯成文字,更有小測驗和遊戲,幫助學生自行學習。雖然這個網站以英語使用者為對象,未來他希望能加入其他少數族裔語言,如烏都語。軟件發明後,他也曾跟一些慈善機構合作,已經率先在一兩間少數族裔學校中作教學輔助,他期待能進一步推廣這套軟件,讓更多不懂中文的學生受惠。

少數族裔小朋友們學中文很困難,因為語言能力而錯失很多工作機會。(政府新聞處圖片)

少數族裔小朋友們學中文很困難,因語言能力錯失很多工作機會。(政府新聞處圖片)

鑽研人工智能20年

用人工智能分析語言情緒的工具,在英語世界已經廣泛應用。「如2016年的劍橋分析公司幫助特朗普根據不同言論、喜好等,分析社交網站上哪些人屬共和黨支持者,哪些屬於民主黨。我們也是做類似的。」陳偉光表示,中文難學,所以比較少人從事這方面的研究。「語法結構、語意結構,其實都比較難,我卻很有興趣。」

他在澳洲研讀博士時開始,就做人工智能中關於「自然語言分析」的研究,「20年前讀人工智能會被人說是儍子,因為那時最熱門的題目是網絡,當時我讀這個,別人都說,你回來沒有工作可做。」

但他偏對這範疇很沉迷,因為他最想探討的是:「將來有天,人類會否被機器取代?會否能做出一些與人類相近的東西?」這20年來,人工智能發展迅速,人工視覺、人工語言能力都已經非常成熟,而人工智能控制的無人飛機、無人地鐵到無人車,都陸續在空中和路上行駛。作為研究者,他從來不看科幻電影,對於機械人叛變統治地球的故事沒太大興趣。他可會相信有天人工智能會取代人類?

「我覺得會。20年前我已經跟朋友討論過,究竟他們會覺得,是自己控制紅綠燈還是被紅綠燈控制?其實是後者,只是如今的科技已經超越簡單的紅綠燈,將來機器或者會控制我們,但從人類進步的角度去想,是要走這一個方向。但那個終點是否我們都想到的,每一個人都有不同的答案。」

如今人工智能被廣泛應用,也引申出不同問題。如人面識別系統非常成熟,也讓人擔心私隱被侵犯,更讓人憂心的是,這工具會成為威權統治的有效手段,限制民眾的行動。而他所研發的語言分析系統,雖然可以幫人學習語言,但也可以應用於政治監察和操控上,他也認同有這樣的可能,強調工具是中性的,如何應用是他無法控制。「但不斷追求進步,不斷進化,就是人類的本性。」

發展人工智能的最大爭議是,縱然工具是中性,但發明出來後,是否真的會對全人類都好?會否成為更鞏固少數人權力的工具?這些年來也有不少辯論。對這些問題,陳偉光如此回答:「一把刀發明出來,可以拿去切橙,也可以指向其他人。要看一個人如何用。但作為研究人員,只是想突破自己,只要不是違反人性,我覺得都應該要做。」

在研究路上,指導老師James Franklin(右)給了陳偉光(左)不少幫助。(受訪者圖片)

在研究路上,指導老師James Franklin(右)給了陳偉光(左)不少幫助。(受訪者圖片)

每天16小時追電兔

就如AlphaGo這個強大的自我學習系統出現後,沒有一個人類能勝過它。在未來,是否人類許多工作都將會被取代?在強大的運算系統面前,人類無法比擬,將來還可以做什麼?「AlphaGo現在只是局限在棋盤上,但未來科技愈來愈便宜和快,可能很快有超級AlphaGo出現。但仍有一些地方,是人類仍能貢獻的。如今一些決策也不能靠機器做,我們離被機器取代的世界仍很遠,機器如今仍只是一個輔助決策的工具。如自動車仍需要有個駕駛者存在,才能確保駕駛安全,在危急情況下,仍要有人去做最後的把關工作。」他也指出,在這發展趨勢下,最大問題是基層的人可能變得更弱勢。「在愈來愈趨向智慧型的社會,基層的人會過得愈來愈辛苦。」

陳偉光成長於1960年代,當時百業待興,他也是出身基層,小時候也經歷打開米缸沒有米的日子,卻憑努力考上中大,投身人工智能研究,只是覺得人類需要仰望到更遠的地方。

他以賽狗為比喻,場上需要有一隻跑得比狗快的電兔,在牠們前面不斷奔跑,才能夠吸引參賽狗隻不斷追逐跑下去,發揮體內潛能。電兔不會累,因此狗隻也能不斷向前跑。人工智能對陳偉光來說,就是那隻電兔,是他不斷想完善的事。「每一個人都要找到自己的目的,如果找不到那個目的,就會渾渾噩噩,當你有目標,就能朝那個目標去做,不斷改進自己,不受其他雜念影響。不然閘開了,人也只是在場上晃晃蕩蕩,不知道自己要怎樣。」

辦公室內的四面牆,他每天都會相對16小時,但他卻覺得樂趣無窮,沉迷在人工智能的世界。這些年來,身邊的人都不太明白他做什麼,也不太感興趣,他倒不介意。「我只是在自己的空間,樂在其中,外邊放煙花,我也不太關心,只是關心我的研究,也不太喜歡去旅行,不覺得去外面看北極光什麼的會很開心,因為那些不能成為我的電兔。」

—————————————–

陳偉光小檔案

出生地點:香港
職銜:中文大學工商管理學院副教授
學歷:中文大學理學士及哲學碩士、英國曼徹斯特大學理學碩士、澳洲新南威爾士大學博士
—————————————–

撰文:張綺霞

[email protected]

更多張綺霞文章:

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們