從無知掌握規律 (車品覺)

By on September 23, 2020

本文作者車品覺,為紅杉資本中國專家合夥人、阿里巴巴商學院特聘教授暨學術委員會委員,為《信報》撰寫專欄「全民大數據」

輪盤結果看似隨機,也可能是一種無知。(維基百科圖片)

輪盤結果看似隨機,也可能是一種無知。(維基百科圖片)

曾經有兩男一女走進倫敦一家俱樂部,他們專注於輪盤博彩,連續兩晚贏了過百萬美元。賭場起疑後翻看閉路電現,隨後立即報警,媒體僅報道他們帶有小型電腦及鐳射掃描器,但沒有透露細節。類似故事也曾在澳門的賭船出現過。

你可能會問:輪盤結果不是應該隨機的嗎?我們先定義這是什麼樣的輪盤。賭場用的輪盤大多來自法國的原始設計,共有38個格子,分別紅黑交替,數字由1到36,加上0及00。按照概率,我們平均每38次會猜中一次,但裏有兩個假設:1)輪盤是毫無瑕疵的;2)有足夠長的時間去驗證正常概率。而前述的幾位職業賭徒,就是希望找到「有缺陷」的輪盤,嘗試尋找「不隨機」的地方。隨着這些新聞的出現,有偏誤的輪盤變得愈來愈少。

對於人們來說,懷疑一切和全盤信任是同樣輕鬆的事情,因為這兩件事都不需要反思。(法新社資料圖片)

對於人們來說,懷疑一切和全盤信任是同樣輕鬆的事情,因為這兩件事都不需要反思。(法新社資料圖片)

早在十九世紀,有幾位數學家熱中於隨機性的研究,輪盤更引起了偉大數學家龐加萊(Henri Poincaré)的關注,原因可從他的一句名言中參透:「對於人們來說,懷疑一切和全盤信任是同樣輕鬆的事情,因為這兩件事都不需要反思。」他認為,輪盤結果看似隨機,也可能是一種無知。龐加萊把無知分成三種程度(Degree of ignorance):第一程度無知是自以為擁有所需資訊,簡單計算就能找出正確規律;第二程度無知是知道了物理定律,但無法精確測量小球的起始狀態,僅能預測極短時間內的狀況;第三程度無知是不知道小球的起始狀態,也不知道相關物理定律,或者定律過於複雜無法理解(小球移動的軌跡受許多因素影響)。這些輪盤理論繼續在影響着很多混沌理論的學者。

但我最感興趣的是,當我們處於「高度無知」, 但事件發生的原因複雜到難以理解,這時候只要我們有能力記錄大量事件的相關資料(大數據的特徵),然後用機器學習就可以找出有用的重複規律,可讓我們跳過前面的兩度「無知」,直接掌握部分答案。情況就好像要在淘寶客戶群預測誰是下一個會換新車的客戶,這好像很隨機,但從大量數據裏可以發現剛開始有孩子的家庭,他們明顯有更大的買車意願,相對有規律。

只要有能力記錄大量事件的相關資料,然後用機器學習就可以找出有用的重複規律,直接掌握部分答案。(Freepik網上圖片)

只要有能力記錄大量事件的相關資料,然後用機器學習就可以找出有用的重複規律,直接掌握部分答案。(Freepik網上圖片)

更多車品覺文章:

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們