當其他廠商還更多地將注意力放在「如何利用大資料進行產業轉型和企業創新」時,微軟已經開始展示如何利用正確的技術和工具,讓每位普通大眾都能從大資料中直觀獲取洞察。
10月18日,微軟全球高級副總裁、大中華區董事長兼首席執行官賀樂斌在「大資料媒體日」上對記者表示,「與其他公司處理大資料的方式不同,微軟主張從發現資料、分析資料和對資料進行視覺化的處理這三種方式來思考大資料的使用。 微軟大資料願景是,希望基於標準化的產品,使所有人都能夠在任何時間任何地點利用資料,並更好地做出決策。 」
大資料並不只是針對IT行業,也不只針對企業分析團隊或財務部門等。 任何人,只要他需要針對業務或日常生活做決策的話,就應該能夠獲取資料,並有工具幫他把這些資料變成有意義的資料,然後基於這些資料做出更好的決策;而不需要其他人為他專門準備這些資料。
微軟的技術專家還在活動中展示了近幾年微軟在研究的「城市計算」專案進展,這些專案能通過大資料技術切實解決城市交通擁堵、城市能源和防災救災等問題。 其中,和普通老百姓關係最密切的,就是通過分析城市道路交通即時狀況、計程車歷史記錄、計程車趴活記錄和即將路過計程車,所構建的計程車推薦系統、最佳路線推薦系統和大規模即時動態智慧拼車系統等。
如何思考大資料
說起大資料,很容易讓人產生的一個誤解是認為大資料一定是非常龐大的資料集或者資料量。 但大資料實際上所展示的是,數量、速度和多樣性這三個維度的概念。 微軟認為,大資料的核心理念並不等於資料的量級。 大資料可以處理大的資料,也可以處理小型的資料;可以處理關聯類型的資料,也可以處理非關聯式類型的資料。 而最重要的一點是怎樣能夠從資料當中得出非常精准的價值。
「這些認識改變了微軟獲取資料和思考資料的方式。 」也就是說有更高級的工具和技術,可以説明人們提高獲取大資料的經濟性,真正讓人們改善大資料發現,改善大資料分析能力,改善整個環境和改善企業運營的方式。
賀樂斌介紹,基於Excel的一些工具,微軟有三種非常簡單的方式來分析資料。 比如用Power Pivot,可以獲取任何系統的資料,並可以以非常簡單的方式整合起來,不管是SAP系統還是使用者自己系統內的資料。 同時,通過Power Pivot可以使資料變成有意義的資料。 另外,通過PowerMap和PowerView,還可以以直觀的方式將挖掘與分析的結果呈現給出來,尤其是在地理的位置上,讓資料對你說話。 由此,揭開大資料的神秘面紗。
如何駕馭大資料
到底從哪幾個方面駕馭大資料呢?賀樂賦說:「微軟大資料理念,就是通過先進演算法説明使用者更高效地挖掘有用資料,通過智慧化的、甚至是基於雲端的平臺和服務去管理和分析資料,從中獲取有價值的洞察資訊,再以使用者最熟悉、 最直觀的形式表現出來,從而説明使用者做出決策。 」
具體而言,微軟大資料解決方案包括三大層面:第一是大掌控,支援所有的資料類型的現代化的管理層。
微軟資料管理平臺可以無縫地存儲和處理包括結構化、非結構化和即時資料在內的所有類型的資料。 微軟推出的HDInsight是一種適合企業使用的、基於HDP的Hadoop服務,它將Windows的簡易性和可管理性帶給Hadoop,提供了結合Hadoop的擴展平臺,並為大資料提供了靈活且可擴展的雲, 使用者可以根據自己的需求選擇Windows Server或Windows Azure平臺。
第二層面是大智匯,搜索並結合全世界資料,對其進行先進的分析與精煉,從而提高資料價值的富集層。
通過將資料和模型與公開的資料服務相結合,微軟大資料解決方案實現了突破性的資料發現,例如自動探索與共享防火牆外部和協力廠商資料來源等。 通過使用Windows Azure Marketplace中的應用程式和智慧挖掘演算法,使用者還能發現更多隱藏的資訊與資料採礦模式。 此外,微軟大資料解決方案還能通過公司資訊化管理工具將原始資料轉換成可靠一致的資料,並通過SQL Server 分析服務(SSAS)的高級分析功能來實現資料的精煉。 微軟大資料解決方案支援Mahout等常用的協力廠商工具和框架,還可支援以C++, C#, Python, Ruby和Pearl來編寫定制的挖掘演算法。
第三層面是大洞察:通過大家熟悉的工具,如微軟 Office,為所有使用者提供直觀洞察力的洞悉層。
微軟大資料解決方案致力於人人可用,它可以使客戶通過大家非常熟悉的由Hive add-in for Excel生成的Excel介面,從Hadoop功能中獲取有價值的洞察力。 也可以經由企業熟悉的BI工具,如SQL Server 分析服務(SSAS)、PowerPivot以及通過Hive Open Database Connectivity (ODBC) 驅動生成的Power View來分析Hadoop中的非結構化資料。 通過集成. NET和新的JavaScript庫,微軟簡化了Hadoop中的程式設計。 開發者可以在JavaScript中使用新的JavaScript庫來輕鬆編寫MapReduce程式,然後通過一個簡單的瀏覽器來部署他們的JavaScript代碼。
如何讓資料分析平民化
對於整個大資料的發展趨勢和應用前景,微軟大中華區副總裁兼市場戰略部總經理、微軟大中華區首席雲計算戰略官謝恩偉總結得深入淺出。
他眼中非常突出的趨勢有三個。 第一個是資料量的增長非常快,第二是資料類型也在層出不窮,第三是從硬體、存儲等方面,資料存放裝置的價位不斷往下調整,這讓整個資料的存儲或資料分析會變得更加接地氣,更加能夠讓大眾都用起來。
基於這些對市場未來的判斷和把握,微軟現在希望做的一件事,降低資料分析的門檻,通過最簡單、最平民化的一系列工具,再通過現有的一些雲的平臺或者基礎設施的服務,把大資料帶到每個人的身邊。
謝恩偉在現場隨手顯示了一個名為City Next的Windows 8應用,類比一個「市長」,如何非常簡單的在桌面上看到一個城市的日常運行指標,比如供電量、城市概況,旅遊狀況等。
當這個「市長」核查能源管理問題時,他不僅能分析怎樣在市政建設中真正做好節約能量的工作,還能查看國外的具體案例,學習其他城市是怎麼來規劃能源的。 比如,他可以對比美國達拉斯這個城市的能源管理,跟我的市政建設形成一種什麼狀態等。 從一些非常視覺化的能力當中,可以讓政府機構,或者政府一些決策者,真正瞭解達拉斯這樣一個城市怎樣去規劃供電站、怎樣去更新房屋年代,從而來降低能源損耗。 而所有這些分析和洞察,都可以基於Excel表格、PowerMap提供的一系列的圖表就能夠看到。
據悉,在工業製造、金融保險、醫療衛生、公共服務、交通運輸等行業中,微軟也都可以提供從前端的資料獲取到後端的洞察力呈現,全程為客戶業務增長服務、創造價值。
謝恩偉總結說,客戶的現實需求是微軟大資料解決方案的出發點和目的地。 微軟解決方案的關鍵在於提供最易用、平民化的大資料工具,並整合在資料處理、雲計算以及Office BI軟體上的技術優勢,以及對使用者使用習慣的理解,將這些資料轉化成了能夠直觀體現趨勢洞察,説明使用者決斷的有價值的資訊。