http://hk.apple.nextmedia.com/financeestate/art/20120813/16598480
大數據( Big Data)可說是近年炙手可熱的課題,互聯網及手機網絡上浩如煙海的資訊,如何可以化成有用的訊息,作為業務上的機會,或政策上的指引,是一條價值萬億的問題。無論如何,這股趨勢已不可擋,繼有對冲基金分析 Twitter上的留言情緒來炒股後, Google也成為中央銀行的借鏡對象,不但用來改善預測經濟的能力,更可能用來預防下一波金融危機。
單單今年6月份, Google已錄得1190億次搜尋,這個超級數據庫,如何變成有用的資訊? Google的首席經濟師 Hal Varian(在學術界名氣甚大,其中級教科書是不少修讀經濟的本科生指定讀物),數年前已發表報告,講述如何可以透過 Google的搜尋關鍵字數據,來改善汽車銷售、房屋銷售的預測。他發現,越多人搜尋及瀏覽汽車資訊,往往預示汽車銷售會上升,又或搜尋失業救濟等字眼越多,也可能意味失業率上升。
關鍵字搜尋量 預視需求
最新一期《商業周刊》便報道,越來越多中央銀行,開始追蹤關鍵字趨勢來研究經濟。好像英倫銀行收集 Google上關於求職津貼的關鍵詞數據來預測失業率;西班牙央行則用旅遊相關搜尋,來預測英國遊客入境數字;連紐約聯儲局亦採用 Google的數據,來提高按揭轉按數字的預測準繩度。
Google現時透過 Google Trends,發放一至三日前的搜尋字統計,雖然並非即時數據,也已經較收集傳統的經濟數據快了不知多少。
除了搜尋字外,最近有學者亦使用 Google的搜尋器原理,來研究金融體系的系統性風險。銀行與網頁如何相提並論?因為 Google為用戶尋找最相關資訊的方法,是先計算某網頁有多受歡迎,而受歡迎的準則,是有多少網頁連結至該目標網頁,越多連結者,間接代表網頁的資訊有用,故此會給予較高的分數。
同理,某銀行對系統帶來的風險,不一定關乎資產規模或問題貸款的多寡,而是與其他銀行的連繫網絡,若它出事會拖多少銀行落水,以及這些被拖落水的銀行的脆弱程度。換言之,是網絡效應主宰系統性風險。
銀行連繫網 揭系統風險
據《彭博社》報道,研究只使用了有公開資料的銀行互相持股關係,再放入修訂了的 Google搜尋運算法計算,已發現2008年時,巴克萊、美銀、摩通及蘇皇,比花旗、德銀有更大的系統性風險,即使後二者的資產規模及生意均大得多。若能進一步掌握銀行間的資產負債資訊,計算便可以更準確,令銀行會帶來的系統風險清晰化,監管當局出招時便可以打在要害。
當然,這些新數據目前大多是補足原來的統計方法,仍不能取而代之,有效性亦要觀察,而且 Google數據佔整個互聯網的訊息量,份額正因為 facebook等社交網絡的出現而減低,不過,大數據的世紀已經來到,你的行蹤、購買習慣、交友網絡、情緒、健康狀況、政治取向都已一一記錄,相信不出數年,連人口普查也開始變得多餘。
丘亦生
金融中心 fan page:
http://www.facebook.com/hkfincentre