網上版請按此

HKEJ 18Oct2018

 

得數據者得天下

 

「知識就是力量」是我讀書年代的金句,後來「知識」換成「科技」。不過,時至今日數據才是萬能鑰匙、「新石油」,是新經濟如無人駕駛、人工智能的推動力。

 

研究機構IDC估計,全球在大數據和商業分析的市場價值,會由2017年的1500億美元,大幅增長到2020年的逾2100億美元。數據有什麼用?發掘客戶需要、替產品找尋潛在買家,或用來開發新產品。

 

經典案例是美國的「尿片+啤酒」,育有幼兒的爸爸逢周五下班回家前,都會奉命到超市為孩子「入貨」,順道也為自己購買周末必備的啤酒。超市透過分析客戶的交易數據,發現了這個風馬牛不相及的消費模式,成為使用數據促銷的經典個案。

 

掌握數據最多的是政府,換言之「原油」庫存極多,不過多數只屬存倉,用途有限;甲部門的原油和乙部門的可能油質不同,即是數據的格式有異,不加以提煉整理,便不能把彼此的數據對比、分析,更不能讓人工智能進行「機器學習」。

 

簡單來說,現在政府把數據限於內部使用,甚至只是自己部門使用,僅開放予個別機構研究,停留在試驗階段,數據的潛力我估計只能發揮10%以內。

 

以新加坡為例,當地要把所有民生相關的政府網站打通,市民只須登入一次,由繳費、簽署文件、申請公屋,到買賣房產汽車也可在網上平台無縫交接完成,一如Google登入賬戶後,Gmail、YouTube、搜尋等全部貫通。這樣市民節省了多少時間?對政府的滿意度又可提升多少?把各自的客戶介面統一並連結起來,一個看似簡單的動作背後,政府要統籌多個部門,我想即使身經百戰的特首也感吃力。

 

港府隻字未提開放時間表

 

這個問題全世界一樣,洛杉磯是早於2015年獲選為全美國開放數據第一名的城市,當時的首席數據官(CDO)Lilian Coral來港分享時便說,最艱難的任務是游說數以十計政府部門提供數據。

 

2018年《施政報告》對開放數據的陳述「所有政府部門須在今年底前制訂和公布其年度開放數據計劃」,既未見到真正開放數據的時間表,內容更隻字未提,我雖不感意外,卻只覺可惜。香港要追上全球創科大潮,不知又要再浪費多少時間。

 

我的本業是地理資訊系統,明年是公司在美國成立50周年,能屹立數十年並成為全球50大軟件之一,自然有它過人之處。不過,如果沒有數據,這個軟件只會跟電腦桌面裝飾無異。因此,今天我們講創科、講人才、講醫療科技人工智能、講智慧城市,如果欠缺最重要的數據,也是空談。

 

    

鄧淑明博士
香港大學計算機科學系榮譽教授