2012年11月4日 星期日

大資料+機器學習:微軟重奪霸主地位的希望


機器學習(Machine Learning)是研究電腦怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。它是人工智慧的核心,是使電腦具有智慧的根本途徑,其套用遍及人工智慧的各個領域。不久前,《紐約時報》報道了微軟將機器學習套用於新業務。Lightspeed(光速創投)美國投資總監Jeremy Liew也介紹了「大資料加機器學習」重塑銀行信貸業的例子。

套用機器學習技術,軟體和服務都是盈利點

在下一個Office版本中,Excel將可以合併處理大量的資料。比如,能夠掃描1200萬條Twitter訊息,然後生成一個圖表,告訴你哪一個奧斯卡提名者被人們談論得最多。Outlook新版本新增的功能可以評估使用者的電郵閱讀習慣,判斷哪些郵件是使用者想去閱讀的。微軟的機器學習軟體將能夠對公司電腦系統進行抓取,就像必應搜尋引擎抓取網際網路上的網頁和連結一樣。

來自感測器、連線的裝置和雲計算中心的資料大爆發造就了大資料產業。電腦要從每天生成的海量中找到規律和模式。長期來看,微軟希望能夠將更多的機器學習技術運用到它的雲計算平台Azure中去,比如租賃資料源和演算法讓企業設計自己的資料預測引擎。微軟最終可以透過軟體服務收費,而不是僅僅銷售軟體。

微軟有一些創業公司所沒有的東西:巨大的資金儲備——上一季度末的財報顯示,現金和短期投資一項為670億美元——同時有能力在一個大項目上投入十年、甚至二十年的時間。Gartner的資深研究員David Smith說,「微軟的資源太多了,Windows、IE瀏覽器、Skype、必應搜尋等等,他們能做許多事。資料分析將會是他們的下一個大生意。」

碎片化關聯,「另類信貸」模式顯現

一些初創公司用海量資料挖掘和演算法來做一些貸款業務。

Wonga就是一家剛剛興起的替代貸款的初創公司。投資機構Accel的Sonali De Rycker是Wonga的董事會成員,他介紹說:「他們大量的使用了社交媒體和其他的網路工具,但這些都是絕對想不到的。而這正是他們的奇蹟所在。」

問題的關鍵在於演算法,它怎麼把你的郵遞區號,你的車的色彩,你的按揭是多少,它怎麼能將你這些碎片化的東西關聯起來。 這些都是Wonga對於它過去客戶的各種碎片化資訊的資料堆積和整理,這非常關鍵。在Accel在2009年進入Wonga董事會的時候,Wonga已經 有了10萬個貸款案例。這10萬條資料資訊不斷整合和歸類變成了一個日益增加的資訊網路。其中每個貸款人都擁有6000到8000條資料。

「你用大量的資料串成了一個故事。我們願意為這些資料付費,因為我們需要它。我們可以透過上千種組合來判斷做某件事是對的,還是錯的。」

伴隨大量的資料來源和強大的大資料分析工具,這也意味著它可以比其他發薪日貸款機構可以以更低的利率貸款。機器學習的依據就是不良貸款,所以失敗的次數越多,你交的學費越多,同樣的你的模型就會越完善。

大資料時代有了更多複雜的商業模式,但目前只是表面。在接下來的幾年裡在這個領域裡將會看到更多的創新點。

沒有留言:

張貼留言