Don't Miss

大數據根基在利益分配(車品覺)

By on November 9, 2016

本文作者車品覺,為紅杉資本中國基金專家合夥人、原阿里巴巴集團副總裁,為《信報》撰寫專欄全民大數據

任何零散的數據一旦連結形成大數據,便會威力無窮。就拿醫療數據為例,如果我們把人類生物學的複雜性比作一部動畫電影,那麼在一百年前,我們對這種複雜性的了解大約相當於電影畫面的一個圖元。可是,若看完整部電影,我們便很容易知道它說的到底是怎樣的一個故事。醫療大數據的建立,正是了解整部電影的最佳視窗,所以說當各大醫療數據成功實現了聯防,癌症便不再值得害怕。

尋共同「痛點」助鼓勵分享

在龐大的市場及科研潛力面前,夏特(Eric Schadt)這位試圖讓醫療數據共用成為現實的先驅者,顛覆傳統創立了自己的基因數據公司Sema4,一個致力創建千萬級基因技術庫的基因數據平台。雖然這件事情非常偉大和有意義,但其面臨的困難亦無疑很巨大。連夏特本人也無奈承認,「儘管已經投入數十億美元,用於對現有數據網路進行現代化改造和提供安全保障,但數據洩露事件仍然時有發生。」若不徹底根治這問題,支撐項目的信任基礎將變得脆弱。

然而,病患的醫療數據屬於個人擁有?還是醫生與病人共同創造的呢?任何大數據的形成必須經歷兩個過程,即開放與規範,兩者為遞進關係,前者是深度連結的前提,後者涉及數據的可用性。實現從零到一的過程中,首先就必須找到個體與機構之間的平衡點:人們有意願把自己的基因數據分享嗎?憑什麼?企業結集了這些大數據之後,又如何對個體有益呢?若不能達到互利,又怎樣讓更多人願意貢獻出自己的基因數據呢?

下一步要解決的問題,是如何鼓勵已擁有大量數據的醫療機構願意共用數據,讓各企業或者業務單元放棄自己的數據孤島。從我過去在阿里巴巴的經驗中,唯一的方法就是找出共同的「痛點」,當得到的利益高於他們之間的競爭,共用會變得理所當然。

接着便是規範化,我們費勁辛苦收集到的數據,該以什麼方法加工,然後成為解決問題的原材料呢?數據界大致分為兩派,一派堅持原始數據,即盡可能保持數據的原貌(裸數據)。另一派較喜歡把收集的數據規範化和格式化,根據使用的場景進行預處理。其實,數據是虛的,Solution才是實在的,沒有場景作目標的大數據如同散沙,但太實相的大數據又不靈活。所以說,不論金融大數據抑或醫療大數據,都會經歷從無到有、從有到高度連結、從連結到即時流通,最後經過工程化把數據提煉成隨時可用的「業務石油」。到那時,毋庸置疑,它會產生龐大的商機及無與倫比的回報率,但是投入的代價也着實並不便宜。

 

更多車品覺文章:

支持 StartupBeat

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們