Don't Miss

細說古今人口普查 (車品覺)

By on July 27, 2022

本文作者車品覺,為紅杉資本中國專家合夥人、阿里巴巴商學院特聘教授暨學術委員會委員,為《信報》撰寫專欄「全民大數據」

數據是客觀衡量世界的一種方式,是客觀存在,經過主觀觀察、記錄和歸納,成為分析的原始素材。隨着信息化的發展,大數據時代的到來,數據涵蓋範圍不斷增加,包括了數字、文字、聲音、圖像和視頻等,它們愈來愈多以非結構化的形式存在。

自古以來數據的收集都比較零散,不但欠缺系統性的規劃,而且數據分析的動機往往是被動響應(postmortem)居多,也就是說因為某些事情的發生,觸發起分析的需求,為此針對性地採集數據來應對。

隨着信息化的發展,數據涵蓋範圍不斷增加,愈來愈多以非結構化的形式存在。(法新社資料圖片)

隨着信息化的發展,數據涵蓋範圍不斷增加,愈來愈多以非結構化的形式存在。(法新社資料圖片)

被動響應的好處是比較節省資源,但壞處是「數」到用時方恨少,例如想比較3年前用戶每天停留某手機應用的時長,才發覺之前根本沒有收集到這個數據。巧婦難為無米炊,再好的數據分析工具也徒勞。因此短期分析的數據需求與長期數據收集之間,需要取得平衡。愈是大型的數據採集,更要謹慎衡量效果。

不過,歷史上大型的數據採集還是有先例可循,聖經《撒母耳記》記載以色列國王大衞王(推斷公元前1040至公元前970年)曾命約押(Joab)統計以色列人口,筆者相信當時的人口流動沒有今天這麼隨意,通常常住(或者常駐)人口就代表了某地方的吸引力及稅收。

在內地,統計局已能夠充分利用手機的數據來預測人口流動與國內生產總值(GDP)的關係。(新華社資料圖片)

在內地,統計局已能夠充分利用手機的數據來預測人口流動與國內生產總值(GDP)的關係。(新華社資料圖片)

到了公元前六世紀,羅馬「王政時代」的第六位國王塞維.圖里烏創立了「人口調查」(Census)制度,而這個人口流動數據到了今天依然是城市競爭力的關鍵指標之一。

國際上公認的現代人口普查是1790年從美國開始的,至今全世界已有200多個國家和地區進行過2000多次人口普查。人口普查的發展經歷了不同階段,最初的階段1790至1870年,當時正值一些國家力求了解本國及其殖民地的潛在資源,包括勞動力資源。

愈是大型的數據採集,更要謹慎衡量效果。(法新社資料圖片)

愈是大型的數據採集,更要謹慎衡量效果。(法新社資料圖片)

第二次世界大戰至今,統稱戰後人口普查,亦即現代人口普查階段,世界人口普查取得了巨大的發展,覆蓋人數已經是世界人口九成以上。為適應社會發展及科技的變化,普查項目的種類也在增多,數據的來源及更新也有了很大發展。在內地,統計局已能夠充分利用手機的數據來預測人口流動與國內生產總值(GDP)的關係。有研究指出在某社區外賣食品的多樣性,也可以反映工作人口的質素。

在香港,第一次人口普查始於1841年,自1961年起每10年進行一次人口普查,並在兩次人口普查之間進行一次中期人口統計,內容包括教育、遷移、經濟、房屋、住戶、人口及社會特徵等。你可能會覺得這些都是政府研究項目,企業有類似的需要嗎?我們下周再探討。

(編者按:車品覺著作《覺悟.大數據》現已發售)

歡迎訂購:實體書、電子書

更多車品覺文章:

支持 StartupBeat

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們