無論是在構建大資料的應用程式,還是僅僅只想從開發的移動應用中得到一點點啟發,程式師現在比以往任何時候都需要資料分析工具。 這絕對是一個好東西,所以很多公司從程式師的需求和技能出發,構建了一些資料分析工具。
在過去的幾年裡,Derrick看到了很多初創公司,各類專案以及開發工具等等,它們都旨在為程式師帶來先進的資料分析能力。 有時候,程式師們會使用簡單的腳本開發出強大的顯示效果,或者在開發過程中使用一種更簡易的方式來實現資料的交付功能,Derrick相信這是一個很有意義的發展趨勢。
在雲計算和移動應用的世界裡,圍繞一個簡單的應用開創一個新事業已經比以往要容易的多。 甚至在大公司,開發者都在為推銷應用或者推進應用的貨幣化而奮鬥。 不過在應用的開發過程中,開發者可能需要加入一些資料流程,這樣才能讓應用「火」起來。
毋庸置疑,大多數程式師的工作都是圍繞著鋪天蓋地的代碼而絕非資料流程。 所以程式師們可能需要一點點説明,Derrick為開發者列舉了12種工具(按字母排序),不過他表示也可能會有遺漏一些不錯的選擇,如果細心的讀者發現的話,請在文章評論中留言。
1. BitDeli
BitDeli是今年11月份在三藩市成立的一家初創公司。 它能衡量出任何使用Python腳本的應用程式的指標,聯合創始人兼CEO Ville Tuulos告訴Derrick,腳本可以很簡單,也可以很複雜——甚至未來可以延伸到機器學習。 不過和「重量級選手」Hadoop相比,BitDeli自認為是一個羽量級的Ruby。
2. Continuuity
Continuuity是前Yahoo首席雲架構師Todd Papaioannou和Facebook HBase的工程師Jonathan Gray的心血結晶,Continuuity想讓所有的公司都能像Yahoo、 Facebook一樣運營。 該團隊創建了一個大資料工具,它可以簡化Hadoop以及HBase集群的複雜性,而且包含一系列開發套件,旨在協助程式員開發大資料應用,該平臺採用Hadoop技術,允許開發者在防火牆內外對大資料應用軟體進行部署、擴展和管理。 公司聯合創始人兼首席執行官Todd Papaioannou表示,作為一家初創企業,Continuuity正在試圖掀起下一波大資料應用軟體的浪潮,公司所提供的工具能夠大大提高處於開發狀態的軟體不同部分與階段的擴充性。
3. Flurry
Flurry是移動應用統計分析領域裡的標杆,正因為在行業內獨特的優勢,它每年的營收高達一億美元。 Flurry擁有非常全面的功能,不僅僅只是説明開發者構建移動應用,它還説明開發者分析所有的資料,進而產生更大的效益。 其實資料也支撐了該公司的廣告網路,他們通過資料分析可以説明開發者推送準確的廣告到需要的使用者面前。 不過單純從移動應用的資料統計功能來看,Flurry絕對是處於領先地位。 其功能模組設置合理,分析維度全面,分析流程也易於理解。
4. Google Prediction API
Google Prediction API可能是最酷的工具了! Google Prediction API是一個基於雲服務的機器學習工具,它可以説明開發者分析資料,並為應用程式加入情感分析、反垃圾郵件、追加銷售分析、識別可疑活動和診斷等功能。 這套API支援眾多程式設計語言,比如.NET、Go 、JAVA、PHP、Ruby、Python、JavaScript、Objective-C以及應用指令碼語言等。 Google的開發者主頁提供了相關的培訓和開發指南,讀者可以訪問Prediction API介紹頁面進行學習。
5. Infochimps
儘管Infochimps非常努力的想讓自己成為一家企業級的IT公司,但是顯然還有一定的差距。 不過與公司同名的平臺的確為開發者們帶來了真正的價值。 配置和管理大資料環境的工具稱之為Wukong——這是一個基於Ruby的命令列介面,開發者可以編寫大資料應用調用Data Delivery Service或Hadoop,使用的語法也非常簡單, 開發者無需學習MapReduce或者Flume。 Infochimps的首席戰略官Dhruv Bansal介紹:常見的情況是,客戶用Infochimps的平臺開發程式處理分析資料,只有在需要批量分析海量資料時才會用到Hadoop。 基於這種經驗,他們的新版本關注的重點是對資料的即時處理功能(而不是Hadoop)。