手機大數據限制和潛力 (鄧淑明博士)

By on March 5, 2020

本文作者鄧淑明博士,為香港大學建築學院及工程學院計算機科學系客席教授,以及團結香港基金顧問,為《信報》撰寫專欄「科網人語」。

新冠肺炎疫情嚴峻下,突顯了保護個人資料和維持公共安全的兩難。(新華社資料圖片)

新冠肺炎疫情嚴峻下,突顯了保護個人資料和維持公共安全的兩難。(新華社資料圖片)

全球流動通訊系統協會(GSMA)有一個「大數據為公益」(big data for social good)的倡議,鼓勵手機網絡商無私地和政府、公營醫療機構分享手機數據,以協助應對天災人禍。內地傳媒近日就引用百度地圖的遷徙大數據,分析了武漢500萬市民在1月封城前兩星期,前往了哪些地方,包括內地城市、港澳東南亞等。這些分析只使用整合的數據(aggregated data),並沒牽涉個人的私隱。

可是,由於今次新冠肺炎源自武漢,當地市民自然成為眾矢之的,在全民恐慌下,個人私隱成為了犧牲品。網上有一篇文章,題為「武漢人是否還應該有隱私」,不少武漢回鄕民眾的家庭地址、身份證號碼以至手機號碼在社交媒體上廣傳,成為了「公開被線上追殺的通緝令」。

有關工作人員對個人私隱的輕視態度固然令人擔憂,而疫情嚴峻下,更突顯了保護個人資料和維持公共安全的兩難。被喻為史上最嚴的私隱條例、歐盟的《通用數據保障條例》(GDPR)也指出,在人道救援上,如須監察傳染病和天災人禍,便不用徵求數據主人的同意。

大數據分析和預測模型是基於許多設定,有偏差的設定只會產生有偏差的結果。(路透資料圖片)

手機大數據並非無敵,因數據分析和預測模型是基於許多設定,有偏差的設定只會產生有偏差的結果。(路透資料圖片)

而且,即使把數據匿名化和整合,科學期刊《自然》的文章稱,只要有4個以上的數據點,依然有機會辨識出個人出來。

因此,美國耶魯大學研發員Nathaniel Raymond擔心,公私營機構有可能不當使用手機數據,假如落入販運人口集團手中,更變相幫助不法分子識別亟待救援的災民,故此他極力提倡要制定一套完善的手機數據使用指引。

誠然,手機大數據也並非無敵。加拿大西門菲沙大學的學者Susan Erikson,便以手機數據不能預測到2014年伊波拉病毒在西非爆發的慘痛例子,力證不應盲從手機大數據潛力無窮的說法。

原因之一是大數據分析本身的問題:分析和預測模型是基於許多設定,有偏差的設定只會產生有偏差的結果。

今次的疫情令人思考手機位置數據在防控和預測傳染病的價值,香港要成為真正的智慧城市,必須提升疫症的預警能力,故此政府好應該把握是次機會,徵求電訊商把匿名並整合了的手機位置數據予研究人員分享,讓他們累積實戰分析經驗;同時也要集思廣益,運用這些數據制定完善的指引,為推動智慧醫療發展打好基礎。、

(編者按:鄧淑明博士最新著作《你未來就緒嗎?》現已發售)

歡迎訂購:實體書、電子書

更多鄧淑明文章:

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們