親睹Machine Learning辨別靚仔靚女(林天程) – StartupBeat

親睹Machine Learning辨別靚仔靚女(林天程)

By on January 11, 2017

本文作者林天程為《信報》撰寫專欄「價值投資

圖片來源:huweijie07170

圖片來源:huweijie07170

過去兩星期,除了上周三,恒指每天都錄得升幅,成交額大概500多至600多億元。本欄曾提及過的價值投資型股票中,最奪目算是大昌集團(00088),股價除了創1年新高,更創了3年新高。大昌集團是本地的小型地產商,亦有投資美國地產業務。以往分析該股,優點包括資產價值大折讓、債務很低、現金流充裕、預期收入不俗,而且股息穩健;缺點是股價波動小兼且交投不活躍,但過去幾天價量齊升,值得投資者注意。詳細分析以及公司估值,可參考舊文,在此不贅,免得被指呃字數。

人工智能四個層次

昨日車品覺兄在「全民大數據」專欄,展望今年的科技發展趨勢時提到:「人工智能與大數據的巨輪將繼續全速前進」。上星期其中一宗大新聞,是贏遍國際棋手的Master自揭身份為AlphaGo升級版。Master的圍棋對弈結果除令人驚嘆,亦再次掀起廣泛的人工智能技術討論。

其實坊間對「人工智能」至今未有一致定義,若硬要區分,則可嘗試用四個層次觀之。第一級是加裝了控制程式的家電用品,所謂的「內置人工智能」等字眼只是gimmick,實則是系統工學。第二級是典型的人工智能,程式系統的行動模式變化多端。這級別的人工智能可以理解input和output的關係,並產生大量組合,實際應用包括醫學診斷。第三級的人工智能,則包含了機器學習程式,系統會根據大數據找出input和output的關連,就如模式辨認(pattern recognition),然後自行作出判斷,近來媒體經常提及人工智能,多數屬於這級別。第四級的人工智能則是加入深度學習,即整個過程中有很多變數和組合。

人工智能(artificial intelligent)、機器學習(machine learning)和深度學習(deep mind)都是近來的熱爆詞彙,看到就覺得複雜和技術含量極高。上周筆者參與一個程式員聚會,其中一位講者Andy即席演示如何使用神經網絡(neural network)鑑別相中人是男或女。他說,坊間有多種相關的開源軟件,讓程式員直接使用,包括Google 的TensorFlow,又笑指深度學習只是多加幾層(layer),增加變數,然後隨即在熒幕上將code連貼幾次,令系統更「deep」。然後將預先準備好的1300+人類大頭照片輸入,再執行開源碼,系統即多次嘗試分析。一般而言,幾次之後會找到更佳的組合,提升辨認男女的機率,數分鐘就運行完畢。Andy再輸入10多張照片讓系統辨認,程式根據剛才的學習結果分析,並估算相中人是女性和男性的機率。當晚系統表現不俗,能正確辨認大部分相中男女的性別。這次即席示範,讓筆者感到機器學習和深度學習技術並非那麼高深莫測(至少當日的codes都大致看得懂)。雖然開源碼背後的理論和技術極高階,但就如各位使用智能電話或搭飛機,也未必會理解其運作原理,而普羅大眾應用AI和機器學習軟件時,也不需要完全理解背後邏輯。現在是大數據時代,大數據和人工智能相輔相成,只要數據量夠大,系統記憶體夠多,而且運算速度快,就可應用人工智能技術。

筆者要真正了解人工智能,顯然有極大段距離。套用不同程式員的簡潔解畫,是本體論(ontology),將不同數據(包括文字和句子)切割,並以數字表達。而各種數據間的關係,則以數學的多度空間顯示,然後形成龐大的神經網絡。

寫了咁多,整篇文就似「不懂扮懂」的介紹文,兼且和投資扯不上關係。其實,筆者想說明的是,並非只有大公司或研究所才會探討和開發人工智能和機器學習。既然有開源軟件,任何人只要懂得寫程式,就可以輸入數據測試效果。當晚有程式員提到股票分析是機器學習的熱門課題。以前市場由人類行為組成,現時已加添了很多程式活動,未來只會愈來愈多機器行為,並且以指數式增長。未來的金融市場,不論趨勢策略或經濟循環,都不能和過往相提並論。

Facebook 專頁:www.facebook.com/trendalysis

 

更多林天程文章:

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們