10個詞彙看世界﹕網絡爭奪戰 Where定勝負
01-09-2014

【明報專訊】「大數據」今天已成為熱門詞彙。隨着人人在線產生大量數據,全球數據庫前所未有膨脹,如何令數據「說話」,從而掌握趨勢及作預測,成為互聯網兵家必爭之地。隨着流動器材普及,地理數據更成為下一個爭奪市場。致力經營旗下地圖的Google正搶佔先機,為人類真實世界組織資訊。但大數據除了為人類生活提供便利外,亦引發愈來愈多關於私隱以至經濟模式的爭議及反思。大數據將為人類開拓一個怎樣的世界?本報將一連兩日探討。

華盛頓大學電腦科學專家伊茲奧尼(Oren Etzioni)可說是利用大數據開創商機的先行者之一。他利用航空業訂票數據,開發出可預測機票價格走勢的系統Farecast,讓消費者可以推算買機票的最佳時機。若數據顯示該航線的機票價格通常會下降,系統便會建議用戶暫時不要買;若數據顯示價格會上升,系統便會建議現在要買。截至2012年,Farecast預測價格走勢的成功率為75%,為用戶平均每張機票節省50美元。

價格預測系統見證數據庫威力

伊茲奧尼2008年以1.15億美元將Farecast售予微軟,微軟將Farecast融入搜尋器Bing的價格預測功能,但卻於今年4月停止有關功能。伊茲奧尼向本報解釋,Farecast能否準確預測機票價格走勢、有效運作,取決於數據庫有多強大,Google收購了Farecast的數據供應商ITA Software,微軟又不想向Google付鈔,令Farecast無法再有效運作。微軟停用Farecast之際,Google卻加強旗下航班搜索功能,連伊茲奧尼本人也經常使用。

Farecast的衰落,既說明了數據量的重要,也反映Google在開拓大數據潛力的優勢。隨着愈來愈多人在生活上依賴Google,Google得以坐擁龐大數據庫。以Google翻譯程式為例,靠的便是全球網絡上不同語言的翻譯,當用戶輸入要翻譯的字句時,Google的演算法便在這個龐大數據庫找尋相關字句,推算出合適的翻譯字句。Google的演算法及數據庫,正是該公司能夠雄霸網絡的原因。

三大版圖Google fb各佔其一

但Google的願景不止於為網絡資訊編索引,而是要組織真實世界的有形資訊,令這些資訊向人人開放及變得有用,Google苦心經營旗下地圖及街景便可見一斑。Google Maps的高級產品經理古普塔(Manik Gupta)向《大西洋月刊》稱,現實世界很多資訊並未完全上網,但當人們日益四處走動,有需要縮窄真實世界及網上世界的距離,Google Maps正扮演了這角色。《紐約時報》去年12月一篇有關Google Maps的報道,形容網絡爭奪戰主要關乎三大版圖,第一塊版圖是「什麼」(what),Google已憑其卓越的搜尋演算法佔領;第二塊版圖是「誰」(who),已由facebook佔領;但最關鍵的一塊版圖是「哪兒 」(where),暫時仍未有哪方完全勝出。

「哪兒」這類搜尋佔了Google桌面搜尋的兩成,但隨着流動器材普及,不少專家相信更重要的是「位置感知服務」的發展。隨着「物聯網」發展,未來所有物件都會具備這一資訊,能讓用戶知道鎖匙等物件位置,甚至可讓自動車前往找尋這些物件。這願景何時能實現雖然仍是未知數,但肯定的是,一張理想的地圖是這一關鍵。Google一直不斷擴充地圖資訊,包括收購其他地圖數據,並透過開發街景計劃實地拍照調查及配合搜索引擎,為地圖提供準確資料。Google地圖向所有人開放,讓用戶加上「地標」及其他資訊,令Google地圖愈趨完善,這個以Google地圖為核心的生態系統亦為Google開發中的自動車提供基礎。

地圖定位 未來必爭之地

用戶使用Google地圖所提供的便利之際,也向Google披露定位資料的信息。思科估計,流動器材的數目至2014年底便會超越全球人口。各大網絡公司早已針對流動器材開發廣告。隨着流動器材普及,Google的地理數據可能已成為該公司最寶貴的資產。

明報國際組

視頻