在「2013中關村大資料日」的大資料互聯網金融論壇上,天雲大資料馮大志帶來「大資料與金融創新」的主題演講。
馮大志:大家下午好! 非常高興能有機會與大家探討一下大資料對我們金融行業的説明。 我非常同意劉處長說的一句話,只有行業的大資料,而不是說我通過一個大資料去產生一個新的行業來。 所以,我們看從天雲這個角度來看的話,之前我們的產品發佈大家也都理解,我們希望説明企業共同成長,解決企業遇到的問題。
按照我們在做大資料的時候發現其實大資料從我們一個想法到我們怎麼把它落地,面臨著很多的問題。 我在來到天雲之前,做了6-7年的企業級倉庫的建設,裡面遇到了非常多的問題和挑戰,我想今天從另外一個角度來講,我們說大資料怎麼能夠既把它的平臺優勢發揮出來,説明我們去解決一些問題, 同時它的演算法讓成本優勢怎麼在金融中去體現出來,下面是我講的一些主要的方式。
大資料包括現在互聯網的一些發展,給我們帶來的一個最大變化就是個人化,現在越來越強烈了。 金融是一個傳統的資訊產業,我怎麼能夠從這個資訊裡面更好的為客戶服務,這是我們前些年包括金融的一種資訊化、互聯網化,包括電子銀行、網上支付發展這麼長時間之後逐漸積累下來的,形成了這麼多的效果。
現在互聯網,尤其是移動互聯不斷發展的今天,我們發現在一定程度上金融門檻降低了,很多的企業當他有了一定的門檻之後,他可以在非常長的時間裡面切下來一塊。 如果我們現在做一個特別簡單的轉帳交易,包含了轉帳前、轉帳中、你的交易、結算清算,包括轉帳後會有很多的資料在產業鏈條中留下來。 所以,我們在金融裡面就講另外一個東西,剛才劉處長也提到了,如何能夠在這樣一個大的鏈條裡面快速的實現資訊的融合,並回饋到每一個前端的交易甚至操作中,能夠實現我們整個金融的快速回饋和構建。 第三個挑戰就是連接,我們為什麼關注于移動互聯網,為什麼移動互聯網的熱度遠遠超過傳統互聯網,實際上人是一個有感情的,他是一個社會化的動物,他希望在任何時候、任何過程當中大家都聯繫在一起,能夠滿足他的情感需求。 現在很多金融行業裡面,包括保險公司也好,包括傳統的金融行業,它在不斷的建立自己跟客戶之間溝通的管道,這種管道的建立更多是以手機APP形式存在。 所以,從現在大資料的角度來看,當然大資料背後代表了很多的技術,我個人覺得我們金融行業未來的發展就是個人化和回饋。
大資料剛才講了很多的方向和趨勢,但是我覺得大資料對傳統的金融行業來講,其實是有兩個特別重要的一個方向。 當然,這裡面我列了一個,其中這個叫分析的可擴充性,如果大家做傳統的資料採礦時一定深有體會,傳統的挖掘怎麼做? 我們需要有非常多、非常好的博士,包括一些演算法的工程師,我需要從傳統的資料倉儲裡面去抽樣一些資料來,去不斷的優化演算法,回饋到資料倉儲裡驗證演算法,所以整個演算法的週期和準確度很大程度上依賴這些工程師的能力,而且依賴于你的抽樣、 採樣資料到底多大程度上代表了你這個企業客戶的貢獻,這是傳統的方式。
當你的資料分析從一百萬拓展到一千萬,有可能演算法的複雜度會從一個簡單的1到2的區別發生一個質的上升。 這樣的話,我們轉而通過VI,通過一些統計分析,通過制定幾百個圍度的指標來衡量客戶。 但是大資料通過它的計算能力,這種分散式的計算能力能夠在一定程度上實現非常多演算法的分散式運算能力,就像我這裡提到的,我們在給一個公司去做測算的時候,我們有3600萬的存量客戶,在我們的系統上大概20分鐘跑完。 但是傳統的體系架構下,一千萬客戶已經很難做分析了,這樣帶給客戶一個最大的好處是什麼? 我知道任何分析的結果就是一個事實,這個事實就可以直接用來指導對策,這就是大資料可擴展的分析能力帶來的好處。 另外一個,就是大資料對於傳統資料的清洗、資料的品質轉換、資料的治理,在很多層面,大資料可以做非常多的事情。 對於傳統的企業有什麼好處呢? 提升我們時間的處理效率。
這張圖我們看到,我們通過一個非常簡單的實驗演算法,在傳統的分析裡,需要對這個演算法做實驗,從這裡面我們可以看到,進行一個簡單的分析的話,我們就知道年收入大概在多少時大概對企業的貢獻率是最好的, 並不是年收入越高對企業的貢獻就越大,而是年收入在2萬多、4萬多,有可能是二三線城市的普通員工,普通城市的市民可能更希望到我的這個保險公司來買保險。 這些規定其實就是大資料通過一個演算法能夠發現出來一些規律,再把我們沒有預先干預的規律回饋到我們實際的資料倉儲作為一個指導。 因為我知道這東西得出來的結果是一個事實存在的結果,並不是我通過演算法預測出來的,也不是我通過很多的手段類比出來的,而是即時存在的,所以它有快速的分析帶來了一個非常快的回饋。
另外一塊我剛才提到了,我們在整個金融行業裡包含了兩大類資料,第一類是金融業的內部資料。 隨著銀行IT的建設不斷完善,每一個業務在銀行裡面都已經做得非常精細了,而且也非常完善,但是這也帶來另外一個問題,就是資料分佈在企業的不同部門和不同角落裡面,甚至有些資料存在,但是很多人都不知道這個資料就在那。 這樣的話就帶來什麼呢? 如何在金融企業內部去實現資料的融合,去更大程度的發揮這個資料的價值,這一塊在很多的企業裡面,不管是金融,剛才劉處長也提到了,我們在廣電行業也實現了的業務資料的融合,結構化和非結構化,這是我講的內部資料的融合問題。
另外大資料還有一個好處是什麼呢? 它的這種資料庫的資料存儲模式更適合於把結構化、非結構化資料合在一起統一進行需求分析。 剛才我們在下的時候,有一個客戶跟我討論,他特別關注的一個點就是如何把非結構化資料結構化,他為什麼提這個觀點呢? 他認為現在企業裡存在大量的非結構化資料,他需要對這些資料進行分析。 我跟他說,非結構化資料的結構化,我們能提供一個演算法能力和工具,真正如何把非結構化資料結構化,讓它不失真、真實的反映企業的情況,這也是需要行業一起努力的,這也是我們在做大資料時希望合作方跟我們一起來做大這個產業,共同發展。
第三塊,我覺得大資料在企業裡最重要的特點就是品牌建設。 我們現在做的比較多的是輿情方面的監控,包括品牌印象,這個品牌印象包含了比如說光大,我們談到最多的理財,因為它是以理財為基礎的吸引客戶特別專業的一個銀行。 但是,同樣是一個企業的全國的形象,在不同的省份裡表現是不同的,你在西南邊陲的一個重慶市,可能大家對光大的印象跟企業的宣傳形象是完全不一樣的,我怎麼能夠讓一個總部的決策直接一竿子插到底插到基層, 讓每個人都知道在這個地區裡面大家對你的印象是什麼,大家對你競爭對手的印象是什麼。 所以,這樣的話,我們需要用大資料,通過其他技術也好,我們能夠去實現這種輿情方面的監控,把原來我們只是感覺到大家的一種感覺把它量化出來,這是大資料在金融裡面另外一個應用的方式。
第三塊是業務拓展,一個是完善,另外一個是引入。 完善是如何能夠去完善現有的體系,剛才雷總也提到了,現在我們信用評估體系已經很成形了,沒有人能夠去顛覆,破壞性創新這樣一個體系,但是我們可以在此基礎之上,通過客戶的方式引入一個圍度,能夠把這個體系完善一點。 還有一個思路是引入資料,什麼叫引入資料? 現在很多銀行在做互聯網金融,在做供應鏈金融,他為什麼要做這個? 因為他發現當你引入一個新的行業,它有產業上下游資料之後,你可以做更多的資料,可以精准的刻畫一個人,更精准的去描述一個問題,或者說更好的看待一個趨勢,這就是金融行業裡面現在面臨的很多問題,在這裡面, 大家他們談到了很多的互聯網金融、供應鏈金融,現在還談到銀行,其實本質在於如何合理的引入一個資料來源,更好的解決我們未來銀行體系的發展。
上面一塊我們講的是銀行對於金融行業來講如何更好的為我們的客戶提供服務,這樣的話,其實有非常多的方式,讓我們既有了新的資料來源,我們又能夠知道在銀行裡面,在網上銀行,每一筆操作能夠通過分析更好的解決客戶到底想要什麼, 他能夠實現什麼樣的目的,他想買什麼樣的產品,包括劉處也談到了跟很多企業在合作,其實就是想解決如何更好的為客戶服務,金融競爭越來越厲害時,我覺得銀行的形象不再是大而全的銀行,而是專注某一個行業的銀行。
下面我們談到的一塊是我們正在做一個嘗試,能夠把一些分散在互聯網上的碎片化的零散資訊捕捉到,而且能夠把它量化出來,實現對企業價值的分析。 這樣的話,其實對於銀行來講,他有很多可控的可操作的負面控制,比如說金融危機來的時候,這個企業已經倒閉了,但是企業所有的信用狀況在銀行裡是完好的。 在金融危機爆發的時候,歐洲有一家銀行就犯了一個低級錯誤,他的客戶已經快倒閉了,但是他還貸給客戶錢。 我們希望在明年,我們的一些專案能夠説明一些企業去實現金融行業的落地。
以上就是我談到的我們從天雲角度,從我們演算法的角度對金融創新的理解,非常感謝大家,謝謝!
(責任編輯:蒙遺善)