아파치 Lucene 중 subprojects 2002 Apache Nutch 프로젝트에서 유래 하는 둡. 2004 년에 Google 출판 OSDI 제목에 종이 "Mapreduce: 큰 클러스터에 데이터 처리를 단순화", 더 그 영감 절단 및 다른 MapReduce 컴퓨팅 프레임 워크 및 NDFS를 구현 하기 시작 했다 (Nutch 분산 파일 시스템) Nutch의 주요 알고리즘을 지원 하기 위해. 2006는 점차적으로 완전 하 고 독립적인 소프트웨어, Hadoop 이라는 집합 되었다.
2008 년 초에 하 둡 아파치 탑 프로젝트 되었다. 또한 올해, 첫 번째 중국 대용량 데이터 기술 회의 베이징에서 개최. 지난 6 년 동안 Hadoop 큰 데이터 필드에 노란 코끼리를 무명 신인에서 달리는.
이전 중국 대용량 데이터 기술 컨퍼런스 PPT 본질 부:
에 대 한 아래
Memsql 공동 설립자 이자 cto 인 니키타 Shamgunov 분석 "실시간 데이터 분석"
Temp_13101415146899.pdf 니키타 현재 시대는 오늘날의 계산 그들은, 사용 하지만 데이터 성장의 속도, 중단 하지 않았다 그리고 데이터의 다양성 폭발 했다 빨리는 다는 것을 지적 하는 무어의 법칙의 끝. 그는 오늘날의 큰 데이터 기술의 가장 큰 도전 대기 시간, 특히 데이터 대기 시간 및 쿼리 대기 시간 문제 임을 주장 합니다. 트위터의 Strom Cloudera의 임 팔 라의 기술 비교, 후 그는 Memsql의 성능을 자세히 설명 합니다.
알리바바 그룹 데이터 교환 플랫폼 수석 전문가 장: 큰 데이터 탐색
Temp_13101415141131.pdf 장 알리바바 그들의 자신의 데이터를 은행 처럼 데이터 재생 푸른 바다 형성에 기여할 뿐만 아니라 모두 귀중 한 데이터를 얻을 수 있는 데이터 교환 플랫폼을 구축할 것 이라고 말했다.
테드 유: 기업에서 HBase
를 적용 하는 방법
temp_13101415172243.pdf Ted는 14 소프트웨어 개발 경험, 그리고 hbase 개발 경험 2 년 이상 2011 되었다 HBase 코드 제출자와 PMC 회원.
Hortonworks 다이 Jianyong: 아파치 돼지
의 성능 최적화 해석
결합기, 규칙 기반 최적화의 건설, 열 pruner의 사용 및 파티션 정리에서 필터 각도를 푸시를 사용 하 여 전체 사용에서
temp_13101415177946.pdf 다이 Jianyong 중간 파일 압축 MapReduce 결합 작업 및 제어 통합 단위는 아파치 돼지의 성능을 최적화 하는 방법을 보여 줍니다.
화 웨이 수석 기술 관리자 Anoop 샘 존: hbase의 레벨 2
색인
temp_13101415173453.pdf Anoop hbase, 실용적인 엔지니어링에 대 한 화 웨이 최적화 작업을 소개 하 고 오픈 소스 커뮤니티 건설 및 장기 프로젝트 축적에 따라 화 웨이의 경험을 공유. 또한, Anoop 샘 존 화 웨이 의해 만들어진 HBase 2 단계 인덱싱 기능에 또한 집중 한다.
NetEase 수석 엔지니어 구 Feiyong: 대량 데이터 포터-울리고
temp_13101415181030.pdf 서울 특별시 Feiyong 원인, 구조 및 울리고, 핵심 기술 포인트 공유, 응용 프로그램 시나리오 및 미래 전망의 특성에 설명 합니다. 대용량 데이터에 대 한 주요 두 핵심 기술은 데이터 수집 및 데이터 통합 및 분석입니다. 서울 특별시 Feiyong 도입 NetEase 데이터에서 컬렉션 비교적 완전 한 플랫폼을 하고있다 하지만 완전 한 대형 데이터 플랫폼을 형성 하기 위하여 백엔드 데이터 분석.
, Miron Livny 위스콘신 대학에서 컴퓨터 과학 교수: 기회와 도전 때 Condor Hadoop
temp_13101415181150.pdf 통합 Hadoop의 슈퍼 컴퓨터 클러스터 Condor 인간 게놈과 같은 복잡 한 문제를 다루는 능력이 매우 강력한 컴퓨터 시스템을 형성 했다. 그것은 전통적인 고성능 컴퓨팅 즉각적인 처리 속도 보다는 대부분 연구의 높은 처리량 요구 사항에 맞는 높은 처리량을 대체 합니다.
야 후 바르셀로나 연구 과학자 플 Junqueira:apache 회계-고성능 믿을 수 있는 사전 쓰기 로그
는
효율적인 순차 쓰기, 좋은 내결함성 및 확장성을 위해 설계 된 Temp_13101415189355.pdf 회계. 그것의 구조는 그들의 구성: 마 권 업자 (스토리지 노드), 레저 (로그 문서), (마 권 스토리지 레저의 세트로) 앙상블.
페이스 북 연구 및 개발 관리자 Shao: 푸 마와 데이터 고속도로-진짜-시간 데이터 흐름과 분석
temp_13101415189033.pdf Shao 구조 뿐만 아니라 페이스 북의 분석 도구 및 실시간 데이터의 사용 사례를 설명 하 고 확장 가능한 데이터 스트림을 위한 PUMA2와 PUMA3 사이의 차이.
, 바이 인프라 부서 Liu Jingrong의 수석 연구 및 개발 엔지니어: HDFS 투명 저장소를 압축 하 고 압축 전송
temp_13101415185482.pdf 압축을 피하기 위해 더 많은 저장 공간을 절약 하기에 영향을 미치는 컴퓨팅 작업을 처리 하 고 사용자에 게이 과정 투명 하 게, 투명 한 사용에서 HDFs에 바이 스토리지 압축 및 압축 전송 기술.
페이 스 북 회사 제리 첸/liyin 탕: HBase
에는 핵심 비즈니스 통신 시스템 구축
temp_13101415191745.pdf 페이스 북 그것의 높은 처리량, 아주 좋은 임의 읽기 성능, 확장성, 및 자동 프로비저닝, 강한 호환성 고 HDFS 혜택 HBase를 선택 했다. 페이스 북 일반적으로 상점 작은 메시지, 메시지 메타 데이터 및 검색 인덱스 HBase에.
이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이
페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.
커뮤니티에서 표절 사례를 발견한 경우
info-contact@alibabacloud.com
으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.