가이드: 우리 모두가 알다시피, 큰 데이터 웨이브는 점차적으로 청소 하는 세계 각 지. 그리고 Hadoop은 폭풍우의 힘의 근원. Microsoft는 아파치 하 둡 커뮤니티와 전례 없는 파트너 이다. 마이크로소프트의 이동 소프트웨어 세계에 그것의 자신의 이점을 활용 하 여 Microsoft 브랜드 Hadoop 생물권을 구축 하는 것입니다.
오늘날, 마이크로소프트는 빅 데이터 전략의 핵심에 Hadoop을 걸었다. 마이크로소프트의 이동에 대 한 이유를 큰 데이터 분야에서 분산된 데이터 처리를 위한 표준 되고있다 Hadoop의 잠재력을 공상. Hadoop 기술을 통합 하 여 Microsoft 고객이 급성장 hadoop 생태계에 액세스할 수 있습니다. 그리고는 Hadoop 플랫폼 개발에 더 많은 재능 있는 사람으로 나 오다, 이것은 Hadoop 개발을 위한 매우 유용.
마이크로소프트의 목표는 아니라 단지 윈도 즈 시스템에 Hadoop을 통합, 마이크로소프트 아파치 하 둡 커뮤니티에 기여 하는 코드에 관심이 있는 커뮤니티에 의해 허용 하 고 싶어. 궁극적으로, 누구 든 지 윈도에 순전히 오픈소스 Hadoop을 실행할 수 있습니다.
는 마이크로소프트 브랜드 Hadoop
마이크로소프트의 Hadoop 버전은 현재 "고객 기술 미리 보기" 단계에 진화 하. 즉, 마이크로소프트 고객 기반 평가 공식 판 2012 년 중반에 출시 될 것으로 예상. 마이크로소프트의 Hadoop은 Windows 서버 플랫폼에 또는 Microsoft 클라우드 플랫폼 Azure에 근거한 다. 1.0 출시 시작 됩니다의 제품 코어 MapReduce와 HDFS, Hadoop 구성 요소 돼지와 하이브 포함 되어 있습니다.
마이크로소프트의 목표는 Hadoop의 모든 구성 요소와 호환 될 것입니다. 동물원의 사육 담당자, HBase, Hcatalog, 및 Hadoop 생태계에서 mahout 또한 Microsoft Hadoop 버전에 연결 됩니다.
마이크로소프트의 Hadoop 또한 자체 비즈니스 인텔리전스 분석 제공과 통합합니다.
Hadoop 커넥터를 쉽게 SQL Server 병렬 데이터 웨어하우스 SQL Server와 통신 하 둡에 대 한 수 있습니다.
ODBC 드라이버 수 Windows 응용 프로그램을 액세스 하 고 쿼리 데이터 웨어하우스 하이브 하이브.
Excel은 Excel과 PowerPivot을 꿀벌 통에서 직접 데이터를 이동 하는 하이브를 액세스 합니다.
백 엔드에서 마이크로소프트 Hadoop, 다른 개선 했다 그리고 마이크로소프트 쉽게 액세스 제어에 대 한 Active Directory를 통합 합니다. 통합된 시스템 센터 관리 직원 관리에도 사용 됩니다.
마이크로소프트 공식 6 월에서 곧 TechEd 컨퍼런스에서 Waad (Windows Azure Active Directory)에 대 한 자세한 내용은 게시 계획. 이것은 Windows 서버 시스템에서 Active Directory의 Microsoft의 개념으로 동일입니다. 기존 Active Directory 배포와 ACS (액세스 제어 서비스)의 미래 사용 좋은 상호 운용성을 보장합니다.
는 자바 Api와 C를 사용 하 여 Hadoop 개발
에 대 한 #
마이크로소프트에 의하여 소개 Hadoop 버전의 가장 독특한 특징 중 하나는 추가 자바 API 이다. Hadoop에 프로그래밍 작업은 지루한, 그래서 다른 고급 언어 (예: 돼지) 표시.
마이크로소프트는 개발자 mapredcue 작품 만들도 돼지와 상호 작용 하 고 브라우저 모드에서 하이브를 사용할 수 있는 Hadoop 환경에 자바 스크립트 레이어를 추가 하기로 했다. 자바 스크립트 레이어의 실제 장점은 그것은 비즈니스 사용자가 액세스할 수 있는 인트라넷 분석 환경을 만드는 개발자가 쉽게 Hadoop 비즈니스 환경에 자체를 통합.
마이크로소프트 서버-사이드 윈도 즈 서버와 Windows Azure 플랫폼에 Node.js 자바 스크립트. 동시에 마이크로소프트 계획 자체 JavaScript API는 아파치에 기여할 오픈 소스 커뮤니티. 이것은 또한 Hadoop 커뮤니티에 대 한 좋은 소식입니다.
더 중요 한 것은, 마이크로소프트 가능 하 게 그것은 사용 하 여 Hadoop 응용 프로그램을 개발 하는. NET 플랫폼. 마이크로소프트는 Api를 사용 하는 기존 Hadoop MapReduce를 만드는 작업을 사용 하 여 직접 계획는. NET 플랫폼. 인터페이스의 더 높은 수준의 릴리스 미래에 나타날 수 있습니다. 시간이 지남에, Visual Studio에서 하 둡 프로젝트의 개발에 대 한 향후 지원 개선 하기 위해 계속 됩니다. Azure에서 나중에 실행 되, 하 둡 프로젝트의 상단에 C# 언어와 같은 공용 언어 런타임 (CLR) 언어에 따라 프로그래밍 하면는. Net 프레임 워크 프레임 워크.
흐름 데이터 처리 시스템, NoSQL
그것은 의심의 여지가 그 Hadoop은 가장 큰 데이터 들에 대해 얘기 하지만 스트리밍 데이터 처리 및 NoSQL은 큰 숫자에 대 한 중요 하다. 마이크로 소프트, 그들은 자연스럽 게 준비 됩니다. 마이크로소프트는 StreamInsight 라는 스트리밍 데이터 솔루션을 발표 했다. NoSQL, 마이크로소프트는 Windows Azure 플랫폼에서 푸른 테이블 이라는 NoSQL 데이터베이스에 또한 있다.
앞, Hadoop에 대 한 Microsoft의 약속 호환성 스트리밍 데이터 솔루션 StreamInsight와 Azure 테이블 핵심 제품으로 마이크로소프트 분산 hbase와 Hadoop 환경의 일환으로 밖으로 굴러 될 의미 합니다. 야 후 S4, 등 오늘날의 스트리밍 데이터 솔루션, 마이크로소프트와 호환 됩니다.
기존의
통합 도구
마이크로소프트의 경향이 큰 데이터 도구 Microsoft 기업에 대 한 포괄적인 데이터 과학 플랫폼을 제공 하겠다는 뜻으로 기존 주요 구성 요소를 통합 합니까? Madhu 레디, 마이크로소프트의 큰 데이터 제품 기획 이사, 긍정적인 답변을 했다. 마이크로소프트의 Hadoop 개발 노력의 주된 목적은 사람들이 친숙 한 도구를 사용 하 고 Microsoft 기존 도구와의 상호 운용성에 초점을 맞추고. 마이크로소프트의 이동 등 개발자, 분석가, 비즈니스 사용자, 모든 수준에서 사용자가 포함 됩니다. Excel은 유비쿼터스 소프트웨어 그리고 하이브 Excel 및 인터넷의 좋은 예입니다. 하지만 다른 도구는 또한 중요 하다, MATLAB, SAS 등 r.
요약
Microsoft 큰 데이터 전략 Windows 플랫폼 큰 데이터 시대에 그 역할을 계속 사용. 그리고 그들의 자신의 클라우드 서비스 데이터 센터 사업에 더 많은 경쟁. 또 다른 방법은 Microsoft에서 완벽 하 게 자신의 크고 다양 한 소프트웨어와 함께 큰 데이터를 통합 하는 것입니다. 마이크로소프트의 초점은 강한 통합을 볼 수 있습니다. 아파치 하 둡 커뮤니티와 협력 하는 마이크로소프트의 새로운 도구와 재능 있는 개발자 플랫폼 마이그레이션을 보장 합니다. (Li/컴파일)
(책임 편집기: 루 광)