紅象雲騰公司創始人童小軍:創業是一個從0到1的過程

來源:互聯網
上載者:User
關鍵字 雲計算 大資料 紅象雲騰 雲先鋒

紅象雲騰(RedHadoop)公司創始人童小軍認為創業是一個從0到1的過程。 每個創業者都只能靠自己去經歷從0到1的轉變,才有資格通過和別人合作完成1到100,即使失敗我們還能回歸到1從新出發。 期望通過別人的1來完成的100往往多是空中樓閣。 這個1有很多了,比如養活自己、獨立的品牌產品等。

從2012年8月出來創業的時候他通過培訓來養家,有大量時間來做自己想做的事情又能解決生存問題。 堅持了一年左右積累客戶和一定的品牌資源。 「我比較幸運,很多客戶都是我之前聽過我的Hadoop課程,研發的產品和服務率先讓客戶應用。 創業兩年多,將創業比作下海,最關鍵的就是自己能養活自己」,紅象雲騰創始人童小軍表示。

北京紅象雲騰系統技術有限公司創始人 童小軍

據瞭解,紅象雲騰(RedHadoop)公司八月底發佈了兩個產品,基於Linux平臺的RedHadoop Enterprise CRH3以及基於Windows平臺的 RedHadoop CRH Studio。 本文來自對該公司創始人童小軍的採訪實錄。

CSDN:首先請你介紹一下自己、公司及技術團隊?

童小軍:大家好,我是童小軍,我是紅象雲騰創始人,我們致力於將大資料(Hadoop、Spark、Storm等)分散式技術帶入更多中國企業,開展有大資料相關的基礎軟體平臺、應用、解決方案、大資料培訓等業務。 公司在業界有廣泛的管道和合作管道,服務客戶有石油、電力、銀行、保險、互聯網、遊戲等擁有大資料的企業,客戶主要分佈于北京、上海、廣州、深圳等地區。

目前公司團隊有在IT行業工作超過十年以上的軟體研發工程師、銷售老兵,有影像處理演算法背景的工程師、也有在知名髮型版本軟體公司負責Hadoop培訓業務的講師,還有一批朝氣蓬勃的年輕小夥程式師,大量支援我們的兼職銷售朋友, 説明我們帶來各種市場機會。

RedHadoop的技術團隊

CSDN:能否和大家分享一下你們最新產品的戰略定位、技術架構以及用到的關鍵技術?

童小軍:RedHadoop Enterprise CRH3:戰略定位是一體化大資料平臺,以此為基礎軟體平台層,我們持續開發應用層軟體。 Hadoop平臺已經成為大資料分析的水和空氣,重要且開源免費,紅象雲騰公司的戰略是夯實底層軟體產品的穩定性,重點在應用軟體的開發,已開發了RedDisk 網盤、SeasBase非結構化資料庫等應用軟體。 最新的CRH3版本軟體中整合了三個計算框架:MapReduce批次處理框架、Spark 記憶體計算框架、Storm 流計算框架。 囊獲了主流計算模型,集成了Mahout、R引擎等資料採礦元件,集成ETL,調度系統等管理系統。

CRH studio(windows版):RedHadoop CRH Studio 是一鍵部署Windows Hadoop 開發環境的套裝軟體。 CRH Studio套裝軟體集成了 Hadoop/Hive 等基礎元件,通過Windows介面快速啟動和配置。 提供 HDFS 工具等方面使用者導入資料,集成Eclipse plug-in 快速開發 MapReduce應用程式,現在我們已經實現了基於 Windows 平臺的圖像檢索功能等應用軟體(SeasBase 非結構化資料庫), 可以快速將視頻運動目標提取並轉化成可以檢索的元素,比如運動物體大小,顏色等,集成基礎的人臉識別功能,未來希望能集成圖像識別能力,現在開放出基礎軟體,影像處理應用軟體沒有開放。 視頻計算的需求未來會越到越密集,新聞上經常出現的刑事案件,都需要通過大資料技術來快速 定位,縮短偵破案件排查,獲得寶貴營救時間。

CSDN:剛才你提到CRH,這讓我想到中國的高鐵,這二者有什麼聯繫? 近幾年來大資料雲計算都很火,你們CRH3區別與同類產品,有哪些特點? 你們目前只做大資料(Hadoop)嗎?

童小軍:是的,其實我們的CRH名稱是ChinaRedHadoop的縮寫,我經常做培訓,講述hadoop、HDFS、MapReduce等概念,很難深刻理解,想到了類比高鐵的基本原理。 傳統鐵路是集中動力火車頭,高鐵是動力分散式列車(Multiple Units,MU),每節車廂都有動力,是城市間紐帶連接的重要交通工具。 相比原來電腦的集中式架構(IOE),現在分散式處理架構Hadoop和動車原理有神似之處。 Hadoop也是每個節點有存儲又有計算,提供充沛動力和功能模組帶動客戶的大資料應用環境。 而不是之前一個小型機拖一個存儲機櫃。 我堅信Hadoop會像高鐵改變我們生活一樣改變數據的存儲和處理方式。

RedHadoop Enterprise CRH3主要有一下幾個特點:

簡易的安裝過程。 CRH3分散式集群的安裝部署非常簡單,我們提供全程化的安裝部署介面,管理員或程式人員不需要修改任何hadoop設定檔,只需簡單地前期準備工作即可。 安裝介面極大的簡化了集群安裝的複雜度,降低了誤操作錄的幾率,提高了成功的百分比。 快速資料導入匯出。 Hadoop目前仍屬於新技術架構,傳統的資料處理模式向hadoop做遷移勢必涉及資料移轉。 RedHadoop Enterprise CRH3提供了快速的資料移轉功能,無論是從傳統的資料庫向hadoop平臺遷移還是在hadoop平臺向傳統的關聯式資料庫移轉CRH3都能夠以並行的方式快速的完成資料同步。 智慧化集群監控平臺。 CRH3提供智慧、專業的集群資源監控管理平臺,這個平臺將集群資源圖形化,以簡單易懂的形式將集群的總體狀況展現給管理人員。 集成了更過更全面的計算框架。 CRH3集成記憶體計算(spark)、流式計算(storm)等業界主流的計算框架。 記憶體計算spark能夠極大的提高部分業務的處理速度。 CRH3同時集成了sparkR,這意味著R語言程式也可以運行在CRH3的spark上。

另外,雲計算作為基礎架構已經廣泛應用,比如阿裡巴巴的ODPS,騰訊雲平臺,百度最新工具(Query Engine)等。 紅象雲(RedCloud)也在開發中,通過集成OpenStack+Hadoop平臺對外提供快速構建Hadoop的基礎服務,很快會和大家見面。

CSDN:您是怎樣看待開源Hadoop與商業版Hadoop的? 你們的RedHadoop Enterprise CRH3 會考慮開源嗎?

童小軍:我認為既然選擇了做如Hadoop這樣的開源軟體,就得抱著回饋開源的思想去研發。 而且不能急於求成,我們開發的元件和更新也會回饋到Apache社區,從開源中來,融化到開源中去。 只有這樣,產品和團隊才能煥發活力。 現在我們人力有限,開源貢獻較少。 長遠角度看,做基礎軟體就像基礎科學,很多時候我們是傳道者,貢獻一點算一點吧。

其次Hadoop已經是大資料的基本標準,通過開源就像大資料生存的水和空氣一樣重要、免費。 Hadoop和大資料事業驅動力首先是興趣和熱愛,Hadoop大資料生意的本質是服務。 水是免費的,依然有礦泉水,桶裝水的需求。 Hadoop大資料基礎平臺之上的應用軟體層,就像手機(Android)作業系統那樣還有很大的擴展空間,本質是開源和免費的,通過增值產品和服務實現公司盈利。

就目前來講很難以公司有限的人力去開發太多基礎產品,所以在基礎軟體部分我們更多的是保證基礎軟體的穩定和易用。 我們開放有 RedHadoop Windows這個產品線。 同時我們提供基於RedHadoop的培訓和認證服務。

CSDN:能和我們分享一下你們的一體化軟硬體產品嗎? 可不可以給我們具體介紹一下它的CPU計算能力、記憶體資源以及存儲能力?

童小軍:基於經驗、結合幾家互聯網公司部署節點,紅象雲騰配置設計了RedHadoop BigData Cluster一體機產品,提供一整套軟硬體一體機環境。 預設三個數據節點,提供3*12個核心CPU計算能力,64*3G記憶體資源,108TB的存儲能力,通過高速網路連接,系統同時還提供Linux操作系 統,RedHadoop Enterprise CRH3軟體, 並導入上千萬圖片和一億多非結構化網頁數據。 軟硬體一體化的設計,讓使用者購買開箱即用的效果。 不斷優化效果方便使用者從 Oracle,SQLserver等系統匯出資料到RedHadoop CRH3中。

CSDN:產品目前的應用場景有哪些,有無一些重量級的客戶?

童小軍:我們主要客戶主要需求特徵是:

以為大資料生產環境典型需求:

海量:資料量在TB到PB級別使用者,使用者群體都過億、歷史資料約萬億條,各省、各功能系統的歷史二級資料存儲結構,有海量資料集中、統一運營的需求。 —這正是Hadoop大資料體系平臺的強項,可以海量、高速、分散式、並行、廉價硬體集群的處理海量資料集中地問題。 高速:平均每小時產生百億級資料,需要在分鐘級別同步,資料在10分鐘內要求可處理、可顯示、可統計等。 加上各種流程採集設備 和即時的採集時間,都要求具備高速的收集載入資料、高速存儲、高速處理的需求。 —– Hadoop的mapreduce+Spark+Storm等計算框架,能夠把海量任務並行、分性質的載入、處理、再合併,可以用低廉的PC伺服器集群架構,滿足高速批量和流處理的需求。 高效:面對終端使用者迅速變化、複雜的需求,要求企業必須提供高品質的BI平臺、資料倉儲系統、統一管理的系統日誌、雲平臺 等可以二次開發的各種複雜平臺。 —–Hadoop大資料體系平臺提供了高級資料獲取、資料清洗ETL、資料分析,最終是要產生智慧化資料,提供洞見,更好 的滿足使用者的需求。 這是大資料處理平臺能迅猛發展的原因所在。

現在主要客戶的需求各異,一般都需要結合Hadoop給各行各業去做對應的定制開發,現在需求第一梯隊來自電信行業,第二梯隊來自金融 電力等行業。 我們總結了各行各業的案例場景,可以到我們官方網站查閱。

CSDN:你們的穩定性怎麼樣? 目前客戶關心最多的問題是什麼? 有什麼針對的解決措施?

童小軍:現在客戶最關心的還是穩定性問題,Hadoop系統承載了存儲和計算等核心職能,好比一個軟體系統的核心發動機。 因為Hadoop系統元件繁多,安裝配置和維護都有一定難度,開源元件彼此有一定相容性問題,同時服務有彼此依賴關係,往往一個底層問題爆發出來會影響整個系統,對應維護管理需要簡化工作。

我們開發的CRH3產品通過一體化套裝軟體的方式解決元件安裝配置等問題。 通過自建集群做大規模的軟體壓力全自動化測試。 在運維管理方面提供完整的監控管理介面。

通過CRH3 Studio 來簡化在Windows平臺上的Hadoop部署安裝難度。 未來基於Windows平臺 CRH3 Server 版本會簡化Windows平臺上的Hadoop配置,集群管理等問題。

CSDN:打造這款產品一定遇到不少的挑戰吧,你們如何處理和解決?

童小軍:Hadoop基礎軟體產品的開發過程中需要大量基礎測試,如何能類比幾百個節點並長期運行是一個難題,我們已經在公司內網搭建了一個生產環境,並導入10TB級別資料進行分析和處理,通過運行大量基礎測試測試軟體問題。

同時客戶環境和需求根據不同行業特性會有較大差異。 需要我們長期深入各行業內部去深度定制。

CSDN:能否總結一下創業的一些體會? 相應RedHadoop產品的未來有什麼規劃?

童小軍:創業是一個從0到1的過程。 每個創業者都只能靠自己去經歷從0到1的轉變,才有資格通過和別人合作完成1到100,即使失敗我們還能回歸到1從新出發。 期望通過別人的1來完成的100往往多是空中樓閣。 這個1有很多了,比如自己造血、獨立的品牌產品等。

Hadoop可以分成基礎軟體、應用軟體、服務租用、培訓服務等服務模式。 在我看來Hadoop生態圈還是缺乏重量級應用程式,如何能將各行各業的應用遷移到Hadoop中,豐富整個大資料的處理和分析應用能力會是我們下一步的重點。

Cloud Edge:中國「雲先鋒」系列報導 序號 公司名稱 成立時間 CEO/CTO 官方微博 公司產品/方向 1. 雲適配 2012年 陳本峰
網站適配 2. 友友 2010年 
姚宏宇
@友友微博 C、C++、JAVA產品研發 
3. 聚合資料
2010年
左磊 
@聚合資料管 移動資料服務 4. Anchora 2009年 魯為民       

MoPaaS和InPaaS 
5. 夠快 2012年
蔣爍淼 @夠快科技 
雲存儲
6. 文思海輝
2012年 吳凱
@文思海輝 OpenStack公有雲       
7. 搜狐雲 2011年 邱英波
SendCloud     &n bsp;            
8. 聯想雲存儲 2009年 羅予晉
雲存儲 9. 南京訊之智 2012年 謝晚霞
大資料即時分析 10. 上海聖何賽 2012年&nb sp;
金劍 

雲管理、雲存儲                
11. 國雲科技 
2010年
季統 凱
@國雲科技 雲作業系統                
12. SSO365 2012年 趙健                

雲安全、雲身份認證 
13. ClouDil雲方案 2001年
葉濱 @世紀鼎利 
通信運營商                
14. 多備份 
2013年 胡茂華            
@木浪 雲備份               &nbs p; 
15. 上海越誠軟體 2011年 王煒                  
基於雲的建站軟體超市 
1 6. 雲智慧 2009年 殷晉 @監控寶 雲監控、基於大資料APM 17. 深圳澤雲 2012年 何巨彬
高性能存儲系統 18. 深圳智冠 2004年 盧慧莉  
手靜脈生物識別、虛擬化 19. 北京沃安科技 2009年 曹學武 @沃安科技 移動視頻技術供應商 20. 星環資訊科技 2013年 孫元浩 @星環科技 大資料分析平臺 21. 紅象雲騰
2012年 童小軍 @RedHadoop中國
基於Hadoop的大資料平臺 備註:2014年9月10日更新,持續更新中......

備註:雲先鋒系列文章是由CSDN雲計算頻道打造的,主要報導國內外在雲計算、大資料方面具有獨特競爭優勢的企業,以傳播技術為目的,推動中國雲計算技術的發展,只有你有雲計算或大資料方面獨特的技術、產品和服務,你就可以投稿, 歡迎投稿weiwei@csdn.net。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.