近年來,很少有IT市場區隔可以像大資料超市一樣吸引企業家的關注。 如今,商業和消費者正在產生TB乃至PB級資料,大量公司也加大了研發,致力於收集、存儲、管理、分析資料。
以下是2014年大資料領域格外矚目的十家新興大資料創業公司
1. Aerospike
創始人和CTO:Brian Bulkowski
包括MongoDB、CouchBD和Redis等公司都在爭奪下一代資料庫的市場份額。 Aerospkie創建于2009年,總部位於加州山景城。 該公司研發了一組用於高性能應用的、即時的、快閃記憶體優化的NoSQL資料庫。
記憶體資料庫滿足可靠交易處理的ACID(原子性、一致性、隔離性、持久性)需求。 Forensiq是一家提供線上廣告詐騙檢測服務的公司,11月Forensiq宣稱其每個月需要用Aerospike提供的資料庫處理1萬億次請求。
年初Aerospike獲得2000萬美金的C輪融資。 11月,Aerospike對資料庫性能進行了優化,提升了存儲能力,並進行了新功能和Hadoop的整合。
2. Altiscale
CEO: Raymie Stata
Hadoop在2014年很火,但是其大資料平臺仍然十分複雜,並且很難用。 這也是Altiscale和它的Hadoop服務引人注目的原因。 Altiscale的服務主要目的是解決Hadoop的抽象性與複雜性,為工程師搭建一個完整的Hadoop環境,並且對其進行維護與管理,讓使用者可以更專注于他們的資料與應用。 當客戶的需求發生變化的時,Altiscale也會做出相應的調整與變化。 他還可以將Apache Hadoop加上業務支援作為雲服務進行交付。
Altiscale,總部位於加州Palo Alto,成立于2012年。 今年10月這家公司開始提供Hadoop上的SQL服務,這使得可以通過使用SQL使用者介面或API訪問Hadoop資料。
Altiscale的高層包括CEO Raymie Stata和CTO David Chaiken都來自雅虎,雅虎也是Hadoop的發源地。 這些人知道他們自己在做什麼。 這個月初Altiscale獲得了3000萬美元的二輪融資。
3. Databricks
CEO:Ion Stoica
2014年,Apache Spark是大資料領域最火的技術之一,它是一款可以像Hadoop一樣提高大資料系統性能的記憶體資料處理引擎。 這個開源軟體來自加州伯克利大學的一個專案。
Databricks提供了一個基於Spark的平臺(該平臺發佈于六月),用於處理資料轉換、探測、分析等大資料任務。 2013年成立的Databricks公司不是一家以開源技術為噱頭的創業公司。 DatabrickCEOIon Stoica(加州伯克利大學的電腦科學的教授)和CTO Matei Zaharia創建了Spark,他們借助大資料一站式服務軟體將他們的專業技術發揮的淋漓盡致。
4. DataStax
CEO:Billy Bosworth
DataStax是下一代資料庫市場的另一個引領者,該公司支援Apache Cassandra。 Apache Cassandra是高擴充性、容錯的NoSQL資料庫,思科、eBay和Twitter都在使用這種資料庫。
DataStax銷售DataStax企業版,這是商化版本的Cassandra,還銷售支援該平臺的工具和服務。 這個月初,公司推出了DSE4.6,其具備新的Spark流分析性能,這表明該公司開始涉足物聯網。
DataStax成立于2010年,總部位於加州聖克拉拉,在9月的E輪融資中獲得驚人的1億600萬美元的融資,當下總計獲得1.9億美元融資。
5. DataTorrent
聯合創始人兼CEO:Phu Hoang
DataTorrent是説明使用者即時處理、監控、分析資料的企業級即時流分析平臺。 該公司聲稱基於Hadoop的DataTorrent RTS系統每秒可以執行數億次、甚至十億次處理。
當今,很多行業在大資料領域面臨的一大挑戰是延遲——如處理類似事務的流資料。 DataTorrent的聯合創始人兼CEO Phu Hoang曾在雅虎領導Hadoop的研發,也看到了類似Data Torrent RTS類產品的發展機會。 這家在聖克拉拉的創業公司成立于2012,在該年6月發佈了DataTorrent RTS,10月發佈了RTS 2.0。
6. Qubole
聯合創始人和CEO:Ashish Thusoo
基於Haddop的Qubole資料服務是一個雲平臺,企業可以用該平臺存儲和管理大量的結構化和非結構化資料,且可執行資料分析和一些其它任務。 你可能說Qubole很自戀:公司注重于使自己的平臺盡可能隨著規模及其他內置管理性能進行自管理;此外,友好的使用者交互自服務和資料整合功能都不需要資料科學家或程式師。
該公司CEO Ashish Thusoo與印度總裁Joydeep Sen Sarma在2012年一起創立了Qubole。 先前他們共同管理Facebook的資料基礎建設團隊,負責大資料處理,之後他們共同參與了Hadoop的Apache Hive資料倉儲基礎建設專案。 月初,這家公司在B輪融資獲得1300萬美元融資。
7. Snowflake Computing
CEO: Bob Muglia
Snowflake Computing于10月悄然出現,推出了基於雲的資料倉儲服務,其服務定位是成為複雜、昂貴本地資料倉儲系統的替代者,旨在實現靈活和易於管理等特性。 Snowflake的Elatic資料倉儲目前還是測試版,在未來將很有可能替代亞馬遜網路服務Redshift和Google的Big Query。
CEO Bob Muglia說:「Snowflake的Elastic資料倉儲服務相較于本地資料倉儲可以節省90%的成本,而且比競爭者AWS和Google的產品更便於使用。 Snowflake Computing目前研發的資料庫系統既可以處理結構化和半結構化的資料」
8. SumAll
CEO: Dane Atkinson
SumAll認為不僅大企業需要大資料分析,中小型也需要。 這家在紐約的初創公司為企業提供了一個可以收集企業電子商務、郵件市場、社交媒體、廣告系統(如谷歌的AdWords)上的資料並在一個互動視覺化介面進行展示的線上分析平臺。
SumAll成立于2011年,側重于產品的易用性,其產品不僅銷往大企業,也銷往中小型企業。 該公司網站的統計資料顯示,公司擁有23.3萬的SumAll使用者,獲得1400萬美元融資,雇員平均年齡32.6歲,每年消費22桶啤酒。
9. Tamr
聯合創始人和CEO:Andy Palmer
大資料的一個問題是資料太大了,大資料通常有很多不同的資料來源,而且這些資料來源一直在變換。
Tamr公司的軟體通過機器學習技術為這些資料來源提供單一視角,同時為企業提供一個完整的資料資產庫存並尋找分佈資料集之間的聯繫。 該公司的技術最早來自MIT的電腦與人工智慧實驗室。
2013年,資料庫專家Michael Stonebraker、行業資深專家Andy Palmer和Ihab Ilyas共同創建了Tamr,今年5月,公司正式運行。 同時,這家基於劍橋和麻省的公司籌集了1600萬美元的風險投資。
10. WibiDat
聯合創始人和CEO:Christophe Bisciglia
大家都很瞭解亞馬遜可以為商戶提供定制化的體驗。 位於三藩市的WibiData創建于2010年,研製了一款可提供類似服務的即時應用。
該公司的Wibi企業平臺使用先進的分析技術給消費者提供推薦、定制化的內容和相關搜尋結果。 該平臺基於一組開源Apache技術,其中包括Hadoop、HBase和Cassandra,也包括用於即時收集、分析、服務資料的Kiji開源框架。 年初該公司發佈了WibiRetail,該應用是公司為零售商提供的首個「開箱即用」的應用。
投資人包括谷歌董事長Eric Schmidt和Cloudera創始人Mike Olson。
原文連結: The 10 Coolest Big Data Startups Of 2014(編譯/仁君 責編/仲浩)
歡迎訂閱「CSDN大資料」微信號獲得更多大資料生態圈資訊。
歡迎關注@CSDN雲計算微博瞭解最新雲計算及大資料資訊。