大資料時代,如何更高效的利用資料為企業做更有價值的決策和發展顯得尤為重要,雲計算的發展和大資料業務的不斷成熟,讓這個話題可「玩」的地方越來越多。 又到一年的「跳槽高峰」,對於招聘網站來說,其存儲的使用者資料價值無論是在有效性和關聯性上都非常有品質,但怎樣利用這些資料做出分析,並且給使用者提供更方便、更有效率的服務則需要借助很多關鍵業務的説明。 在中華英才網(China HR)CTO石磊看來,投簡歷更像是一道統計學命題:透過對大資料的洞察,招聘網站可以做到"比你更懂你自己"。
中華英才網成立于1997年,具有幾千萬、上億的資料資訊,在借助Windows Azure之前,用自己的20台伺服器處理需要幾天時間。 現在通過微軟的雲服務幾分鐘就搞定了。 作為國內率先採用雲計算的線上招聘網站,中華英才網借助Windows Azure雲和大資料服務,讓新職位的平均投遞量提高了80%,網站2014年的訪問量比2013年增長了871.21%、簡歷投遞量增長213.24%。 今年會逐步將所有業務遷移到Windows Azure上來。
求職者和招聘企業最終的目的就是希望找到精准匹配的物件。 通過大資料分析能夠做到機器智慧化的演算法,自動地做到這種匹配。 微軟的技術平臺在資料採礦和資料分析上面就能夠提供很好的説明,HDInsight服務提供了很大很自由的平臺,可以迅速地在幾分鐘部署一個很大的Hadoop的平臺。
為了做到比求職者和雇主都"更懂你自己",中華英才網投入2.5億元重點用於技術平臺的升級和核心人才的引入。 其中,牽手微軟,借助由世紀互聯運營的Windows Azure微軟雲平臺全面提升其校園招聘系統,以雲計算開啟技術轉型的大膽舉措,成為招聘網站雲端轉型的又一看點。
中華英才網在近二十年的發展過程中,積累了海量的人才資料資訊。 特別是在每年春秋兩季的校園招聘季,中華英才網收到的簡歷總量占全年的70%-80%--其中,很多國有企業一天之內收到的簡歷甚至超過10萬份。 資料量的陡增,對伺服器的要求加大,資料量經常超過預期,擴容壓力大;而過了旺季,伺服器及相關IT資源又會閒置下來,造成浪費。
對於中華英才網的CTO石磊而言,這些資料資源既是財富,也是包袱。
由於業務的持續增長和資料不斷積累,中華英才網每次對這些資料備份和恢復的耗時都是很大的,部分資料整理的耗時甚至需要用天來計時。 而且一旦出問題,所涉及的資料將很難快速、靈活地恢復及部署,甚至會出現訪問遺失資料等異常情況。 從安全形度出發,要進行資料異地同步,既耗時又受制于網路頻寬限制,實效性不高,再加上機房條件及硬體設備的差異,在異地切換服務後,伺服器及頻寬等性能上會出現瓶頸和很大的壓力,造成網站訪問異常。
因此,在保障人才資料安全、實現高效運轉的同時,降低海量資料處理和存儲帶來的管理成本,成為了中華英才網技術部門面對的主要挑戰。 經過全面地考察和對比,由世紀互聯運營的Windows Azure微軟雲計算解決方案進入了中華英才網技術團隊的視野。 實際測試表明,Azure的功能和特性足以滿足業務需求,特別是北京、上海兩地資料中心6個異地備份、冷資料快速恢復、冷熱資料高效管理、本地與雲業務快捷切換、優質的頻寬資源等優勢技術,能夠確保資料安全的同時,提升資料同步效率, 讓IT體系靈活、從容地應對每年招聘季的壓力。
對於在全國設有179個城市分支機搆,擁有超過2600名員工的中華英才網來說,要全面應用新技術並不是一件簡單的事--要考慮的不僅是當前技術平臺對接、遷移的問題,更要面向未來的業務需求和發展,進行前瞻性的技術儲備和鋪墊。 未來,線上招聘網站將不僅是為企業和求職者提供一個資訊分享的平臺,更應充分利用大資料、機器學習、智慧演算法為雙方提供精准的匹配。 從這樣的發展構想出發,中華英才網決定借助微軟雲讓自己這艘大船精准地把握方向,將資料儲備從負擔變為優勢資源,實現更快速的發展。
Windows Azure帶來的最大改變就在於全面提升了中華英才網對碎片資訊的利用能力。 微軟雲提供的HDInsight分散式大資料服務,能夠快速方便地部署針對多類型、非結構、碎片化資料分析和應用。 透過求職者在招聘網站上留下的職位搜索、投遞選擇等痕跡,便可以實現極高的精准匹配度。 石磊介紹說,資料分析會發現一個來自體育院校的畢業生其實對電腦設計更感興趣;專業服務行業正在成為就業熱點;求職者更希望找到距離住處不超過30分鐘車程的工作單位等需求和趨勢資訊。 通過對每個企業投遞、購買、成功應聘的簡歷做統計分析,提取關鍵特徵,可以為企業推薦成功率更高的簡歷。 而在使用者搜索職位的時候,即使是相同的檢索要求,針對使用者自身的需求特徵,也會返回更適合個人需求的、不同的結果。
要在未來的競爭中立於不敗之地,企業需要在服務差異化、移動端和行銷模式上進行發展突破,而如何玩轉手中的大資料更是贏得未來的關鍵。 正如石磊所說:"海量的使用者簡歷構成了巨大的人才寶藏,如果不能精耕細作,就會迷失其中。 大資料提供的智慧演算法,就像開啟寶藏的鑰匙,能讓我們18年的資料積累成為競爭對手無法逾越的大資料門檻。