VMware擴展大資料 試圖虛擬化Hadoop
來源:互聯網
上載者:User
VMware宣佈,將允許用vSphere來管理Hadoop集群。 這樣一來,成千上萬的VMware企業客戶將能夠使用他們已經熟悉的軟體來控制Hadoop部署。 從技術方面說,這提高了該公司在虛擬化基礎設施運行Hadoop節點的水準,同時將虛擬化的優勢帶到了大資料平臺。
VMware日前推出了VMware vSphere Big Data Extensions(大資料擴展),這將允許該公司廣受歡迎的基礎設施管理軟體來控制企業客戶建立的Hadoop集群。 該擴展仍然需要一個基礎Hadoop平臺,HortonWorks、MapR、Cloudera或者VMware的合作夥伴Pivotal都基於這個開源Apache代碼來分配。 這個大資料擴展允許這些分配任務通過vSphere來管理。 Taneja Group高級分析師Michael Matchett表示:「VMware讓企業能夠託管他們自己的大資料即服務。 」
VMware通過其Serengeti專案這些功能,該專案的目標是優化Hadoop集群以在虛擬化基礎設施上運行。 Matchett表示,這是該專案邁出的非常重要的一步。 在虛擬機器上運行Hadoop節點,而不是在裸機上運行,帶來了與虛擬化計算伺服器相同的優勢:更有效地使用硬體資源以及更靈活地管理系統。 Matchett表示:「你可以在虛擬環境中託管Hadoop,因為這將讓你能夠混合其他工作負載,並且跨多個用戶端利用基礎設施的優勢。 」
其他公司也在試圖虛擬化Hadoop集群。 亞馬遜雲計算服務提供的Elastic Map Reduce(EMR)產品,基本上是類似Hadoop的公共雲服務。 而VMware主要是針對私有雲和用戶端部署。
為vSphere增加支援也可能預示著VMware的其他舉措。 例如,VMware可能擴展該平臺以允許使用該公司即將推出的公共雲產品(預計今年晚些時候推出)來輕鬆地遷移vSphere管理的Hadoop工作負載。 其他公司(特別是微軟)也將允許通過自己的管理軟體來控制Hadoop發行版本。
VMware推出的這些新功能是公開測試版的一部分,客戶本周可以使用vSphere 5.1來報名參加公測,預計這些功能將在年底正式推出。 除了宣佈這個擴展外,VMware表示Serengeti專案支援Apache Hadoop的最新開原始程式碼,包括新的YARN功能,Hadoop社區的一些人認為這個資源管理器可能帶來更多基於Hadoop平臺的新的應用程式。