You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

大數據估中特朗普當選(高天佑)

By on November 10, 2016

本文作者高天佑,為《信報》撰寫專欄「新聞點評」,此文為節錄版本,原文請按此

特朗普爆冷擊敗希拉莉,幾乎所有民調皆預測錯誤,惟獨不帶感情的大數據卻成功貼中結果。圖為中環戲院里。(何澤攝)

特朗普爆冷擊敗希拉莉,幾乎所有民調皆預測錯誤,惟獨不帶感情的大數據卻成功貼中結果。圖為中環戲院里。(何澤攝)

印度大數據系統MogIA自2004年起預測美國總統大選結果,暫時100%準確,該系統早於上月便斷言特朗普將會勝出,當時各大傳統媒體均一笑置之,只當作花絮報道,豈料MogIA再一次延續其百發百中戰績。

MogIA的預測方法是在Facebook、 Twitter等社交網站上,收集美國用戶的逾2000萬個數據點,例如他們提及兩個候選人名字的次數,以及附帶的關鍵詞和心情,再進行綜合分析,看誰最受「真實民意」支持。當然,此方式未能涵蓋「非網民」意向,故須進行後續調整。

人們現在接受民調時,往往不會透露真正心意,例如明明很受落特朗普的民粹言論,打算投他一票,但面對一位靚女調查員時,或許為了維持「高大上」形象,不好意思承認投給「狂人」。另一種情況是明明撐泛民,但接受票站調查時,卻為了誤導對家配票部署,自稱投了給建制派。

如此種種,均可能導致民調失真,令結果「爆大冷」, 6月英國脫歐公投及今次美國大選的情況都近似。

與之相反,人們在社交網站上通常流露真性情(即使不具真姓名),例如「黃絲」和「藍絲」在Facebook上涇渭分明;因此若能用大數據和人工智能技術,綜合分析社交網站輿論趨向,有助減少失真。

克林頓早已打定輸數

觀乎美國大選歷史,最重視大數據的候選人是現任總統奧巴馬(將於明年1月卸任),他在2012年競逐連任時,其團隊每晚會進行約6萬次大數據模擬分析,藉之決定翌日的競選資源分配。同黨的希拉莉今屆亦承接這種做法,可惜她本人體力不繼,很多原本應加強拉票的地區,最終均未能兼顧;據CNN昨天引述消息報道,希拉莉丈夫、前總統克林頓幾星期前看到這情況,便已經「打定輸數」。

諷刺的是,相對於奧巴馬和希拉莉重視大數據,特朗普卻明言「不玩這一套」,他今年5月曾說:「我覺得大數據的重要性被高估,奧巴馬上屆贏在自己,而非大數據,今屆我也一樣。」

data-10nov

 

高天佑 [email protected]

 

更多高天佑文章:

支持EJ Tech



如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們