對於企業的業務人員,特別是資料科學家人群來說,Informatica的Intelligent Data Platform不僅是一個智慧化的大資料預處理工具,而且可以像業務系統一樣為企業帶來直接的價值。
互聯網企業通常會強調細節和微創新,把產品的某一項功能做到極致,借此牢牢吸引大量使用者。 但是企業級廠商則不同,它們更傾向于將產品平臺化。 平 台化的好處是可以把儘量多的功能集成在一起,方便部署與管理,而且可以借平臺遮罩底層架構的複雜性。 軟體廠商尤喜平臺化,比如資料保護廠商有資料保護和統 一管理平臺,大資料產品廠商有大資料處理通用平臺等。
今年5月,獨立企業資料整合軟體供應商Informatica在一年一度的Informatica World上發佈了Intelligent Data Platform。 作為下一代資料平臺,Intelligent Data Platform可以在正確的時間提供正確的資料,並通過鋪設一條虛擬資料的高速公路,將人員、位置、設備以更加智慧化的方式緊密聯繫在一起,為大資料應 用提供更好的支援。
提升智慧化水準
Intelligent Data Platform包含三大核心:第一,Informatica Vibe虛擬資料機。 Vibe是一種嵌入式的資料處理引擎,可以提供針對任何位置、格式或來源的資料的普遍的訪問能力,且支援客戶「一次映射,多次部 署」;第二,資料基礎設施。 資料基礎設施層能夠在任何規模的環境中系統、連續地交付乾淨、安全、互連的資料,從部門級到企業級,從交易資料到大資料,從內 部部署到雲端皆可;第三,資料智慧。 Informatica獨創的資料智慧層將為客戶重新置放資料基礎設施層所創建的中繼資料,從而提高資料的可見度,改善 決策過程,並提升運營的智慧化水準。
Intelligent Data Platform能夠以正確的方式將正確的資料傳遞給相關的人員或發送到正確的位置。 Informatica公司大中國區首席產品顧問但彬歸納了 Intelligent Data Platform的主要功能:Informatica可以在正確的時間提供最高品質的正確資料;I nformatica能夠將資料交付到正確的位置,包括 企業內部或雲端;Informatica 可以將資料交付給正確的人員,無論是IT人員、分析師、資料管理員,還是企業用戶;Informatica可以將資料交付給正確的設備, 包括聯網設備或自 動化決策系統;Informatica能以正確的方式交付資料,並確保資料安全可靠、經過授權且已獲得保護。
Intelligent Data Platform在Informatica World 2014大會上一發布,即受到了與會的Informatica的使用者的普遍歡迎。 Informatica在大會上展示了一系列Intelligent Data Platform的應用案例,包括自助服務資料整合(Springbok 專案)、資料導向型安全管理(Secure@Source 專案)和360 度全方位業務實體(MDM 10)等。 目前,Intelligent Data Platform還沒有完全商品化。 之所以在Informatica World 2014提前發佈Intelligent Data Platform,Informatica是想在產品正式發佈前先聽聽使用者的回饋,然後根據使用者的回饋進一步對Intelligent Data Platform進行完善,再擇機發佈商用化的版本。 這種在產品正式發佈前先與客戶進行交流已經成了Informatica開發新產品的一個慣例。
為數據科學家服務
有業內人士指出,大資料已經發展到一個新的階段,仍然按照傳統商業智慧(BI)的思路和方法解決大資料的問題已經不合時宜。 傳統BI採用包括資料獲取、存儲、處理、分析和呈現等環節在內的縱向資料處理方式,而新的大資料處理和利用方式則是分散式、扁平化的。
傳統的資料處理方式是模式化的,使用者需要什麼,廠商就提供什麼樣的解決方案,但這些解決方案通常是固定的、不能靈活擴展的。 如果使用者提出了新的 要求,想在原有系統中增添新功能或進行修改會十分麻煩。 而Intelligent Data Platform可以解決這一問題,因為它是一個智慧化的平臺,可以為集中到「資料湖」中的各種類型的資料建立相關性,然後再提供給業務應用或通過介面與 分析工具銜接。
在進行大資料處理時,傳統的資料庫和分析技術還有用嗎?但彬認為,傳統技術與新技術之間不是誰對誰錯的問題,而是要針對不同的應用選擇適合的技 術。 比如,銀行常見的商業行為分析仍然可以採用資料庫技術,而一些預測性的大資料採礦專案則要採用新的大資料處理技術,呈現資料之間的關聯性。
「Intelligent Data Platform給使用者帶來的最大改變是解放了IT人員。 原來IT人員既要做業務也要搞技術。 未來,我們希望IT人員可以把工作重心放在做開發和系統集成 上,而業務人員可以基於Intelligent Data Platform將業務描述得更清楚,並且可以自動生成一些規則。 」但彬介紹說。
支撐Intelligent Data Platform的底層技術是Informatica的Vibe虛擬資料機,它也是所有Informatica產品的基礎引擎。 在這個引擎之 上,Informatica可以説明客戶進行資料整合,提升資料品質。 Intelligent Data Platform是一個集成化的平臺,從IT的角度講,其實施肯定會存在一些挑戰,但它確實能給企業的業務帶來更多價值。 「IT人員可以完成資料的抽取和 存儲,然後提交資料用於分析。 」但彬告訴記者,「但是企業的業務人員或資料科學家可以標記資料的品質、發現問題,從資料中發現更多有價值的東西。 所以,我 們希望業務人員能借助Intelligent Data Platform更多地接觸和利用資料,而不僅僅是IT人員。 」
在推出Intelligent Data Platform的同時,Informatica還提出了「資料湖」的概念。 所謂資料湖,就是將不同來源的資料存放在一起,但並不是將未經處理的資料簡單 地堆放在一起,而是要將這些資料進行預先處理,建立資料之間的聯繫,這更有利於日後的大資料處理。
大資料是業務系統
傳統的資料處理與分析都是IT人員的事,因此IT人員必須掌握豐富的數學知識和電腦技術。 但是,大資料的最終目標是為企業業務和應用服務,而 IT人員通常不太瞭解業務,這就造成了大資料技術與應用的脫節。 但彬表示,Intelligent Data Platform最理想的消費者是企業的業務人員或資料科學家,因為他們更瞭解業務需求,可以利用Intelligent Data Platform更好地解讀大資料分析結果。
大資料處理系統是一個IT工具,還是業務系統呢?不同的定位決定了大資料處理系統的不同「命運」。 「中國的很多客戶通常將大資料處理系統當成一 個IT工具來使用。 從IT運維的角度來看,IT人員只負責保證系統的正常運行、開關,雖然偶爾也會編寫一些代碼,但畢竟不能從業務的角度充分利用大資料處 理系統。 在這種情況下,大資料處理系統只是一個IT支撐和保障系統,而不能直接給企業帶來商業價值。 」但彬介紹說,「如果將大資料處理系統當成一個業務系 統來對待,那麼業務人員就可以利用這個平臺更好地挖掘資料,給業務帶來直接的價值。 」
據記者瞭解,一個具有單一功能的大資料產品可能需要幾十萬元,而一套比較完善的大資料整體解決方案的價格可能達到上千萬元。 如果不能充分發揮大 資料產品應有的價值,那麼對企業來說無疑是一種巨大的浪費。 但彬表示:「如果企業只把大資料產品當成一個IT工具,那麼可能不會持續地對產品進行升級,也 不會購買廠商的專業服務,一旦遇到解決不了的問題,就可能輕易放棄。 」
Informatica曾經帶國內某銀行的技術人員去美國與Informatica的客戶交流。 讓但彬吃驚的是,美國客戶參與交流的全是公司的 業務人員,講的全是業務系統如何運行。 參與交流的中國客戶全是技術人員,想瞭解的是美國企業如何構建一個大資料系統,而不太關心系統如何運行和如何給企業 帶來價值。 如此強烈的反差給中國的使用者提了一個醒:第一,部署大資料應用應該以業務為中心和出發點;第二,企業最好自己主導大資料系統的部署與應用,因為 企業最瞭解自身的業務需求,可以更充分地利用大資料平臺,提高資料分析的效率。