今年7月10日,阿裡巴巴集團宣佈,將在集團管理層面設立首席資料官(Chief Data Officer,CDO)職位,負責全面推進阿裡巴巴集團成為資料分享平臺的戰略。 阿裡巴巴B2B公司CEO陸兆禧將出任CDO,並直接向集團CEO馬雲(微博)彙報。 作為企業內部C level的又一個重要職位,CDO將在推動企業大資料應用方面起到什麼樣的關鍵作用呢? 記者試圖採訪陸兆禧本人,但從阿裡巴巴集團公關部門得到的答覆是,陸兆禧從來不接受採訪。 雖然吃了閉門羹,但是記者並不死心,通過其他管道採訪了業界一些主要的廠商、市場分析師及使用者,希望能將CDO、資料科學家、資料分析師等與大資料有關的這些人、這些事全面展現在讀者面前。
CDO:新型的複合型人才
戴爾(微博)全球副總裁、中國區大型企業及公共事業部總經理容永康告訴記者:「我接觸過的很多中國企業的CIO認為,大資料解決方案是有價值的,但是實施起來確實有許多困難。 比如,國內現在懂得在Hadoop上進行開發的專業技術人員非常少,而一些金融行業的使用者雖然很想現在就部署大資料解決方案,但是苦於找不到既懂資料分析技術,又懂得金融業務的專業人才。 」由此可見,既懂得相關技術,又諳熟企業業務的複合型人才才是企業部署大資料應用最迫切需要的人才,而CDO就是其中的典型代表。
資料歸營業單位,應用歸IT部門。 這一概念在過去幾十年中已經被廣泛接受。 然而現在到了該挑戰這一理念的時候了。 在多陣列織機構中,營業單位並不想擁有資料,他們也不是為管理資料而配備的。 CDO能夠有效執行一套自上而下的企業資料需要的精密化資料管理實踐。
IDC的研究表明,2009~2020年,全球數位資訊量將實現44倍的增長,其中需要管理的檔數將增加67倍,總存儲容量將增長30倍。 企業在PB級甚至EB級的資料中尋找相關資訊無異于大海撈針,將為資訊驅動決策帶來與日俱增的成本和複雜性。 此外,企業資料不是非黑即白,多樣化的資料來源、資料種類以及資訊共用機制正逐步替代傳統的結構化和非結構化的資料二分法。 企業一方面要與外部的客戶、合作夥伴通過文本資訊、社交網路、移動應用等方式進行互動;另一方面,企業內部也會頻繁通過電子郵件、即時通信、博客等進行有效溝通。 企業有責任和義務管理並且保護這些資料。 IDC的調查顯示,雖然企業產生的資料僅占全球資料總量的20%,但企業實際上要對80%的內容承擔起管理的責任。 這就意味著企業必須承擔起與業務有關的資料管理、挖掘和保護的職責。 面對湧動的資料洪流以及資料多樣化的挑戰,企業現有的業務模型很難通過有效的方法和途徑對這些資料進行管理,並充分展現其價值,而且不能對業務未來的發展做出正確預測。 這就是企業對CDO求賢若渴的重要原因。
賽迪顧問IT系統產業研究中心陳靚表示:「當前,資料管理的重要性日益凸顯,並成為現代企業管理至關重要的影響因素之一。 隨著IT技術的發展,企業資料治理作為一個全新的管理概念被提了出來,這正是CDO進入企業高管團隊的重要原因。 」
「在大資料領域,我們今後可能會聽到很多花哨的名稱,如CDO、資料科學家或者首席資料工程師、架構師等。 資料對企業來說變得越來越重要,而且逐漸成了企業核心競爭力的一部分。 企業關注的不僅僅是資料本身,而且會更加重視資料的價值,以及資料對企業產生的影響。 」微軟亞太研發集團首席技術官孫博凱告訴記者,「舉例來說,兩個類似的企業,一個花了很多時間做資料分析,另一個則對資料完全漠視。 從公司業績來看,做資料分析的企業,可以很好地掌控其業務,而沒有對資料進行分析的企業績效會差很多。 從這一點上也可以看出,在資料逐漸成為企業核心競爭力的今天,掌控資料對企業的業務發展有多麼重要。 」
做好「後臺」
CDO的主要職責是什麼呢? 作為企業的執行管理層,CDO將在以下領域中扮演舉足輕重的角色:主導並實施資料管理原則和標準,實現資料品質管理的制度化;衡量並管理資料風險,在執行層影響企業的風險評估偏好;實現更佳的決策支援,通過對資料的有效分析獲得洞察力 ,説明企業改善策略;通過對資料的有效管控及使用,增加企業的業務收入,提升客戶滿意度、客戶忠誠度和市場美譽度;降低合規成本,通過正確運用資料提高生產效率。
「CDO需要支援CEO的決策。 CDO與企業常規設置的CFO、CIO不同,他掌握的是企業內部最核心的資料。 順便強調一下,CTO並不和IT直接掛鉤,也不會承擔CDO的工作,CTO負責的是企業的核心技術,比如製造型企業的生產技術。 並不是每一個企業都會設立CTO。 」Forrester(微博) 高級分析師曹宇欽認為,「CIO的職責在於提供最符合企業現狀和未來發展的資訊技術,包括要實現資料分析的能力。 目前不少企業的CIO或者IT部門負責企業資料的挖掘,但是絕大部分還停留在技術層面。 設立CDO之後,CIO將為CDO提供資料採礦的工具和技術支援,並且把資料分析的工作轉交給CDO。 目前在CFO的職能中,關於企業內部歷史資料整理、分析並預測企業業務發展的部分職責,也將逐漸轉交給新設立的CDO。 」
據記者瞭解,中國移動目前既沒有CTO,也沒有CIO。 中國移動目前已在部分專案中採用了大資料技術,未來還將繼續擴大使用範圍。 基於業務的考慮,中國移動需要以下兩種大資料人才:第一,大資料系統和工具的研發、優化人才,要求對於Hadoop、資料倉儲、OLAP工具等大資料工具具有較深的優化經驗, 最好能根據業務需求對於Hadoop等開源大資料工具進行定制開發;第二,資料分析師人才,要求對於電信經營分析業務具有一定的經驗,能夠熟練使用大資料工具,瞭解資料主流統計分析、資料採礦演算法,能夠根據業務特徵進行建模分析。
「CDO相當於企業的‘後臺’。 在公有雲建設和資料倉儲應用中非常需要CDO。 」市場分析公司ESG中國區總經理王叢表示,「CDO應該懂得資料管理、網路和底層安全知識,瞭解公有雲對IT的需求,並且要擁有多年的資料庫管理經驗。 CTO中的T代表技術,CIO中的I代表資訊,而CDO中的D代表資料,這三者是不能相互替代的。 但是,並不是所有的企業都需要CDO。 」
並非所有企業都需要CDO
百度每天的資料處理量十分驚人,達到了20PB~100PB,當然其中也包含了重複的資料。 不過,百度目前還沒有設立CDO這個職位。 百度在大資料方面做的主要工作包括管理、處理和挖掘大資料,以及與大資料相關的基礎架構研究。 百度在大資料方面的快速發展主要得益于其多年來在雲計算方面積累的經驗,以及在資料梳理方面技能的不斷提升。
百度在大資料方面最津津樂道的有兩點:一是雲存儲(據百度稱,百度目前擁有業界最便宜的雲存儲),二是其強大的資料處理能力。 百度認為,企業在大資料方面面臨的最主要挑戰在於,不知道應該做什麼和不應該做什麼,也就是方向性的問題,這是與業務本身密切相關的。
現在一說到大資料,言必提Hadoop、MapReduce等。 使用者的普遍感覺是,資料量太大,而現有技術的積累和技能還無法跟上資料量增長和處理的需求。 百度認為,使用者只掌握Hadoop、MapReduce等技術或工具還不夠,更需要瞭解哪些資料真正具有價值。 這對CDO來說是考驗。 以互聯網企業為例,因為其擁有的資料量非常大,處理這些資料的投入也非常大,CDO就要考慮投入產出比的問題。
其實,資料採礦並不是一項新技術,已經有幾十年的發展歷史了。 對於使用者來說,如果只是招聘技術人員對相關演算法進行研究,那是沒有止境的。 現在,很多使用者都說要做大資料, 比如NBA球隊在比賽中別出心裁地引入了資料分析技術,甚至有些房地產企業也宣稱要做大資料。 有人笑稱,現在是全民皆大資料分析的時代。 百度認為,真正有用的大資料人才應該可以分辨出哪些工作可以做,而哪些工作不必做。
「從理論上說,每一個將大資料分析應用到業務中的企業或單位都應該設立CDO的崗位。 但是,企業是否足夠成熟來設立這個崗位,取決於企業對於資料採礦的深度以及各個營業單位能否有效地支援CDO。 通常情況下,CDO將直接彙報給COO。 」曹宇欽補充說,「CDO既要懂得企業的業務和運營,又要具備極強的資料分析能力,能夠透過資料看到事件的本質。 CDO不能僅僅停留在簡單收集、整理、分析資料和寫出報告的層面,而是要結合企業自身的業務發展,找出數位背後隱藏的挑戰和機遇,同時將這些洞察應用在具體的企業內部戰略規劃及日常運營中。 」
「我們目前正在準備進行大資料方面的調研。 大資料的分析工作與傳統的應用系統的建設有很大不同。 我們需要既懂得業務,又熟悉資料分析技術,並且能夠把兩者結合起來的綜合人才。 」民生證券有限責任公司技術總監顏陽博士告訴記者。 在推進大資料應用的過程中,顏陽認為企業將面臨以下三方面的困難,一是認識上的不足,很多人並不知道大資料是什麼,因此也就無法知道如何正確地使用大資料工具;二是投入上的不足,大資料的應用可能需要相當大的役入, 一般的企業可能很難承受;第三,大資料人才的匱乏將制約大資料應用的發展。
陳靚認為,從當前國內資訊化應用的現狀來看,有大資料應用的企業一般集中在金融、電信、互聯網等大型企業。 從企業的需求上來看,設立CDO可以解決企業在資料搜集、使用、存儲和再利用方面的難題,同時還能為企業高層提供更好的決策支援。 但是,由於大資料應用在中國的各行業還處於初步階段,很多企業並沒有發展到系統化地使用大資料工具進行深度資料採礦的階段。 CDO的設立應該是企業在資料使用和挖掘上有了成熟的模式以後的事情,否則,盲目設立此職位只能給企業內部帶來冗余的工作崗位和職責上的不明確。
在民航業,大資料的分析和應用已經被提升到了戰略高度。 東方航空公司很早就提出要實現精准行銷和對旅客的個人化服務,而大資料分析是實現這一目標的前提。 據記者瞭解,國內許多航空公司雖然可能沒有單獨設立資料分析部門,但多多少少都會有資料分析這項業務。
東方航空公司資訊部總經理嚴振紅介紹說:「我們需要既懂業務,又有深厚技術背景的人,但並不一定會設立CDO這個職位。 去年,我們在資訊部下面新設立了一個資料管理部,負責公司所有資料的分析、管理和行銷業務。 為了招聘到適合的人才,公司領導特批我們可以按照市場規律,以年薪制招聘適合的大資料人才。 目前,資料管理部有20多人,其中有一部分是公司原有的熟悉業務的人員,另外一部分就是從外面招聘的技術專家。 經過一年多的磨合,現在資料管理部的這些人都成了既懂業務,又掌握相關技術的複合型人才。 我們正在籌建的資料倉儲專案就是由資料管理部一手經辦的。 」
據記者瞭解,東方航空公司的資料管理部還在不斷招人,希望繼續擴大規模。 2013年下半年,東方航空公司的大資料平臺將正式上線運行,主要用於行銷和客戶服務。
陳靚總結說:「CDO能結合企業IT應用,更好地推動企業業務的發展,讓IT價值更大化。 因此CDO將在國內企業中受到歡迎。 工業結構轉型依賴資訊化的進一步發展。 新興的CDO專業人才將為IT發展創造更廣闊的空間,並且更好地促進國內經濟結構的轉型,提高生產效率和企業管理水準。 」
尋覓資料科學家
另一類與CDO一樣受到廣泛關注的大資料專業人才是資料科學家。
「什麼是資料科學家? 」Bitly公司的首席資料科學家Hilary Mason負責從Bitly收集的資料中尋找價值並建立系統,「我的團隊負責建立數學模型,編寫代碼並開發基於資訊的產品系統。 」
資料科學是一門交叉學科,涉及統計學、電腦科學以及特定領域的專業知識等。 Hilary Mason將資料科學劃分為兩部分:一部分是分析,另一部分是從資料中提取具有洞察力的新技術,這在以前是不可能做到的。 資料科學是分析能力和新演算法的結合體。
「資料科學家的工作就是要提出正確的問題。 」Hilary Mason解釋說,「如果我問這樣一個問題,這個連結的點擊數是多少? 這就不是一個關於資料科學的問題。 如果我問這樣一個問題,根據這家出版商網站之前的歷史連結,我們能否預測未來三小時內將有多少來自法國的使用者讀到這個內容? 這就是一個有關資料科學的問題。 」
陳靚分析說:「CDO的職責是為企業的業務和資料提供更好的價值平臺。 通過CDO的工作,企業能將資料轉化為業務語言,被管理層更好地理解和運用。 因此,企業對CDO的資料業務專業性要求並不高。 而資料科學家是專業資料的研究者,其主要工作是對資料及其價值的專業性進行研究,比如資料科學家隊伍中包括資料分析師、資料採礦師、資料視覺化設計師等。 」
做業務與技術之間的橋樑
「大資料項目目的落地一定要有企業高層的認可和支援。 大資料項目目將會影響企業未來業務的發展、經營決策甚至是投資方向。 」
——SAP中國區副總裁、資料庫及技術平臺事業部總經理 鄒作基
「兩年多前,我們與美國的一些金融行業的大客戶接觸時,它們已經擁有了CDO這樣的崗位。 」SAP中國區副總裁、資料庫及技術平臺事業部總經理鄒作基告訴記者,「2008年,國際金融危機席捲全球。 在那之後,金融行業的使用者都加強了對業務風險的監管。 有效控制金融業務風險的一個重要前提就是實現對資料的管控。 金融使用者中設立CDO崗位的比較普遍,但是像製造、零售等對大資料同樣有迫切需求的企業則很少擁有CDO。 」
技術與業務的有機結合
談到中國的企業是否應該設立CDO這一職位時,鄒作基表示:「CDO這個名稱其實並不重要,關鍵是企業中要有人能夠十分清楚業務流程,並且能合理安排與資料分析相關的各項工作。 」其實,所有企業都面臨著激烈的競爭和如何把控業務風險的問題。 CDO的主要職責是將企業內的所有資料有效調動和運作起來,將有用的資訊放到真正需要它的地方。 某些企業的CIO可能兼具CDO的職能,或者企業會成立一個專門的團隊來負責資料的管理。 不可否認,大資料已經與企業的業務密不可分,它很可能在企業未來的競爭中起到十分關鍵的作用。
大資料涉及的不僅僅是技術方面的問題。 CDO應該主要從業務層面去審視大資料的應用。 資料存放在哪裡,資料應該如何處理,哪些人能擁有資料,為什麼要這樣使用資料...... CDO必須能夠明確地解答這些問題。 「CDO應該站在業務團隊和技術團隊的中間,就像是一座橋樑,可以把業務需求與IT規劃聯繫起來。 」鄒作基表示,「CDO其實是一種功能。 CDO能發揮什麼樣的作用,還要看每個企業在大資料方面的需求以及策略。 」
舉例來說,一個零售企業以前可能只能通過CRM系統來瞭解和掌握客戶的需求。 現在,隨著社交媒體的興起,零售企業有必要也有可能從微博、博客、論壇等社交媒體上瞭解與企業和經營相關的資訊。 以前,企業的IT架構不具備處理海量社交媒體資料的能力,但是現在,即時、快速地處理大量的非結構化資料已經成了一種常態。 對於CDO來說,他的職責就是利用IT手段找到企業所需的資料和資訊,併發揮其應有的價值。
從顧問諮詢的角度出發
「十多年前,銀行就設有商務分析師。 這些人主要是從營業單位的角度出發去分析資料。 」鄒作基介紹說,「今天的CDO與這些商務分析師很相像。 不同的是,CDO要面對大資料的種種挑戰,而且資料分析與管理不再是某一個部門的需求,而是整個公司戰略層面的問題。 大資料分析一定是企業級的、大範圍的、跨部門的事情。 」
在業務流程、資料處理和應用方面,SAP已經有了40多年的專業經驗。 「在面對客戶時,SAP不是單純地講述產品的功能,而是瞭解客戶的業務流程,能夠從解決使用者的實際問題出發,為使用者提供更多的價值。 」鄒作基告訴記者,「我們擁有一批專業的價值工程顧問,稱為Value Engineer 。 這些Value Engineer都具有豐富的行業經驗。 在確定解決方案之前,他們會與客戶進行深入探討,分析客戶面臨的困難,向客戶建議應該採用什麼樣的解決方案,以及能夠獲得什麼樣的預期回報等。 」
大資料的分析與管理追求的一個目標是更快的處理速度。 鄒作基說:「SAP HANA記憶體計算平臺是SAP即時資料平臺的核心元件,其設計出發點是不斷提高大資料的即時處理能力。 」SAP HANA是一個軟硬體的結合體,具有高性能的資料查詢功能,使用者可直接對大量即時業務資料進行查詢和分析,而不需要對業務資料進行建模、聚合等。
大資料對所有企業來說都是一個新的機遇。 企業只有擁有了像CDO、資料科學家、資料分析師這樣的專業人才,才有可能將技術與業務有機地結合在一起,從而確保大資料項目目的成功開展。
資料科學家一將難求
「企業的大資料業務,並非一個人就能完全掌控和完成的,而是需要一個團隊。 當然,企業需要一個強有力的領導者,才能把團隊中每個人的才能發揮到極致。 」
——Informatica高級副總裁兼首席資訊官 托尼•楊
有大資料應用的企業都要設立一個CDO崗位嗎? 「我並不認為這兩者之間有必然的聯繫。 一些大型的互聯網公司都有大資料系統,但並不一定有CDO這個職位。 CDO只是一個工作職位而已。 」Informatica高級副總裁兼首席資訊官托尼•楊表示。
參透資料的本質
托尼•楊表示:「許多大型的公司有市場、銷售、財務、人力資源、服務、供應鏈和生產管理等多個職能部門。 所有職能部門都是共同協作的,而不是獨立存在的,這有點像人體中的各種器官。 資料會在各個職能部門的不同系統間流動。 CDO的職責是在這些職能部門的資料中發掘價值,並制定戰略決策。 並不是有大資料應用的企業都要設立一個CDO職位。 一般情況下,CDO會向CTO或CEO彙報工作。 」
Informatica雖然專注于資料整合業務,與大資料打交道最多,但是Informatica公司並沒有專職的CDO。 托尼•楊介紹說:「過去,我們有一個人專門負責資料管理,其職能與CDO類似。 這是一項要求非常高的工作。 負責資料管理的這個人必須具備多種能力,並且要全面瞭解公司的業務運作流程,此外還要跟蹤流動的客戶資料,掌控一個產品的全生命週期。 」
通常情況下,CDO的主要職責包括以下內容:確定公司在資料系統上的戰略重點,從資料中挖掘出新的商機,通過資料優化實現業務創收,將資料作為一項戰略資產進行管理。 「説明企業參透資料和資訊中隱藏的問題,這對CDO來說是最關鍵的職能之一。 因此,能夠勝任CDO這個職位的人很難找到。 」托尼•楊感歎說。
資料科學家獨一無二
作為與CDO關係最為緊密的一類專業人員,資料科學家可以與CDO一起工作,解決企業需要洞察的問題。 「在描述與大資料打交道的人應該具有的能力時,我經常用Insight(洞察力)這個詞。 」托尼•楊舉例說,「我們將相互關聯的、即時的客戶資訊發送給話務中心的職員,他們就能全面掌握客戶的情況,從而為客戶提供更優質的服務。 這似乎聽起來容易,但實現起來十分困難。 」
資料科學家能夠解決複雜的資料問題,但與CDO相比,它更像是高級工程師或高級技術人員,因為CDO的工作內容中還有一部分是進行公司管理和戰略決策,而這不屬於資料科學家的工作範疇。 談到資料科學家應該具備的能力,托尼•楊將其歸納為以下幾點:第一,資料科學家不是傳統的IT人士,它的工作中既包含IT的成分,也包含業務的成分;第二,資料科學家具有很強的邏輯分析能力, 能夠瞭解資料和資訊如何與企業的業務產生關聯;第三,資料科學家還擁有其他多種能力,既瞭解資訊、業務以及資料如何在企業中流動,也知道如何將資訊整合在一起,這是資料科學家擁有的獨一無二的能力。
上世紀90年代,有很多IT專案、ERP專案都沒有成功實施。 究其原因,是因為那時沒有能夠全面瞭解業務流程的專家,企業只能自己邊實施邊瞭解。 現在則不同,企業如果想實施ERP專案,就可以馬上找來相關的專家、工程師和技術顧問等。 這些人很清楚如何去實施ERP專案。 一個專案從頭到尾,可能9個月就能全部完成,而這在上個世紀90年代是絕不可能辦到的事。 「現在,很多企業能夠輕而易舉地完成某個複雜的專案,這是因為有一個團隊在做,而且整個產業鏈中的很多公司也清楚如何去實施。 」托尼•楊分析說,「但是對於大資料來說,它還處在發展的初期階段,沒有現成的模式可以借鑒,企業還需要一段時間去摸索和實踐。 」
既要瞭解業務,還要管理團隊
「資料科學家的主要任務是建立業務所需要的資料模型,這就要求資料科學家掌握高等數學知識,對企業業務更加瞭解。 CDO和資料科學家是企業核心競爭力的一部分,將關係到企業的生死存亡。 」
——VMware全球高級副總裁 范承工
VMware全球高級副總裁范承工介紹說:「我們公司已經擁有一支資料科學家團隊。 這個團隊既為公司內部服務,也會為客戶提供大資料服務。 」在美國,CDO、資料科學家等與大資料相關的專業人才雖然不斷湧現,但是仍然供不應求。
資料庫分析、商業智慧已經不是什麼新鮮事。 任何規模的企業,甚至是企業內部的一個部門都有從資料中提取智慧資訊的需求。 大資料的一個重要作用是説明客戶更容易且以更低的成本利用資料,使得資料分析變得更加平民化和視覺化。 包括VMware在內的一些廠商新推出來的大資料解決方案就可以實現上述目標。 范承工舉例說:「Hadoop是一個重要的大資料平臺。 以前,Hadoop通常運行在物理機上,而沒有在虛擬機器上運行的先例。 VMware對大資料的一個重要貢獻就是將Hadoop移植到虛擬化平臺之上。 這在一定程度上簡化了Hadoop的部署與應用。 」
范承工認為,企業缺少既懂技術、又懂業務的大資料人才是企業大資料應用落地的一個主要障礙。 「很多企業沒有掌握Hadoop技術的開發人員,因此在部署大資料應用時會費時費力。 VMware將vSphere作為Hadoop的虛擬化支撐平臺,同時開發出一些可以簡化Hadoop部署的技術和工具,將以前半自動化的Hadoop部署變成全自動化,從而降低了Hadoop的應用難度, 也減少了因人工作業出錯的概率。 」
「目前,大資料還處於發展的初級階段,只有一些大公司對大資料項目目比較感興趣,但也只是小規模地在幾台機器上試用,而沒有進行大規模推廣和應用。 」范承工介紹說,「現在,很多大資料應用主要分析的還是結構化的資料庫資料。 不過,從長遠發展來看,對非結構化資料的處理將成為推動大資料應用的核心驅動力。 一些能夠很好處理非結構化資料的新產品、新平臺受到了使用者的歡迎。 」
一些專職管理和處理大資料的職位也受到了企業的關注。 「CDO是管理資料科學家的。 CDO既要瞭解公司的業務,還要能管理一個傑出的團隊。 這個團隊中有資料科學家、資料工程師和資料分析師。 這個團隊將負責搭建業務所需要的大資料分析平臺,同時還要為各營業單位及公司負責人提供資料支援服務。 」范承工表示,「假以時日,大多數公司都會設置CDO這個職位。 CDO既有可能向CIO和CTO彙報工作,也有可能向CEO或COO彙報工作。 」
其實,在一些企業裡,CTO或CIO承擔了部分CDO的職能,甚至兼任CDO的職位。 范承工認為,將來,CIO和CTO的工作職責與CDO重疊的可能性會越來越大。