2008 60 남자 "중국에서 Hadoop" 기술 살롱의 현재 수천에서 산업 기술 축제, 7 년 BDTC (큰 데이터 기술 회의)의 사람의 규모는 완전히 목격 하는 중국의 큰 데이터 기술 및 기술 핫스팟의 큰 데이터 필드를 충실 하 게 묘사 하는 응용 프로그램의 변환 수많은 귀중 한 산업 경험 침전 2014 년 12 월 12, 14에서 같은 시간에 가장 큰 중국 데이터 기술 이벤트 기술 핫스팟, 업계의 경험을 공유의 현재 필드를 리드 나갈 것입니다.
더 나은 이해 산업 개발 동향, BDTC 2014, 직전에 기업, 기술 문제를 이해 우리 큰 데이터 탐사도로 분야에 IT 거 인 공유 지식 마이닝의 강 수의 과거 어셈블리에 이동 됩니다.
큰 데이터 기술 뿐만 아니라 기업의 훌륭한 비즈니스 기회를가지고 개발을 위한 대용량 데이터 심각한 도전을 앞으로 넣어, 여기에 보내질 것 이다 이전 중국 대형 데이터 기술 컨퍼런스 큰 데이터 기술 PPT 하이라이트.
다음은 위대한 데이터 기술 중국 PPT 큰 데이터 기술 하이라이트 과거의 회의입니다.
알리 검색 부문 수석 기술 전문가 왕 Feng: 알리 검색 실시간 스트리밍 기술
PPT 다운로드-BDTC 2013의 일곱 번째 세션
왕 Feng 도입 알리 검색 흐름 컴퓨팅 기술 IStream 사업 배경의 탄생, 그에 대 한 자세한 설명은 IStream 계산 모델의 5 개 분야에 초점을 맞춘, 이것이 IStream 컴퓨팅 모델을 보여 처음으로: 기본 개념, 토폴로지 구조, 메시지 관리, 진도 관리, 프로그래밍 인터페이스. IStream의 디자인 "컴퓨팅 및 스토리지 레이어 링, 계산 사이 분리", "메시지 전달의 영구 분산된 메시지 큐와 컴퓨팅 계층 간의", 아이디어 및 업스트림 및 다운스트림 디 커플링, 진행을 차단 하지, 새로운 비즈니스를 만들고 다음과 같이 더 편리 하 게 액세스, 영구 메시지 흐름 그것은 또한 데이터 및 문제 추적의 공유를 촉진 한다.
IBM 큰 데이터 솔루션 프로젝트 디렉터 조지 루: 큰 숫자에서 효과적인 통찰력을 추출
PPT 다운로드-BDTC 2012의 여섯 번째 세션
큰 데이터 솔루션 프로젝트 디렉터 조지 Lapis 먼저 현재 사회 지능을 도입, 2020 년 총 양의 정보 35ZB, 도달할 것 이다 그리고 많은 하지 고정된 직원 대상으로 하는, 고객 서비스, 시장, 애 널 리스트 등 대상 지정할 수 있습니다. 그는 IBM의 대용량 데이터 분석 하 고 해결할 수 없는 전통적인 데이터베이스 구조화 되지 않은 데이터 문제를 해결 하는 전통적인 데이터베이스 최적화 지적 한다. IBM, IBM 설문 조사에 따르면, 2012 년, 2010 년부터 28%는 회사의 큰 데이터 경쟁의 장점을 찾을 수 정보 분석을 통해 큰 데이터 관련 작업 시작, 회사의 47%는 큰 데이터 관련 작업을 계획 하기 시작 했다, 회사의 24%만 큰 데이터 관련 작업을 필요가 없습니다. 큰 데이터, 고객 관리, 운영 최적화, 큰 데이터를 달성 위험 재무 관리, 공동 작업을 직원을 통해 나머지 33%를 달성 하기 위해 큰 데이터를 통해 회사의 18%를 달성 하기 위해 큰 데이터를 통해 회사의 49%를 사용 하 여.
인텔 아시아 태평양 연구 및 개발 Co., 주식 회사 큰 데이터 부 춘: 스파크-차세대 메모리를 기반으로 하는 대용량 데이터 분석 프레임 워크
PPT 다운로드-BDTC 2013의 일곱 번째 세션
춘 소개 2011 인텔 점화 프로젝트에 기여를 시작으로 초기 현재 인텔 중국은 스파크 프로젝트 3 제출자, 7 기여자, 그 기여 패치 이미 70 +. 소개 촉발 자세히, 춘 매우 재미 있는 예를 들어, 휴대 전화, 그 MapReduce로 큰 데이터 시스템 기능 기계로 간주 될 수 있습니다 다음 드릴, 임 팔 라, S4, 표시 하는 경우 전에 폭풍우는 mapredcue에서 다양 한입니다. 그는 걱정 하는 사용자가 자주 스파크, 성능 등, 메모리가 부족 하면 비용, 안정성, 학습, 내결함성 및 호환성을 사용 하는 경우 여러 가지 측면에 초점을 맞추고. 왜 인텔은 최종 현장 상호 작용에서 스파크 프로젝트 개발에 너무 공격적 질문, 춘 인텔 것 더 유망한 오픈 소스 프로젝트의 일부를 선택 하 고 가입, 특정 음성 미래에 경쟁을 유지 하기 위해 인텔을 허용 것 이라고 설명 했다.
바이 인프라 부서 데이터 플랫폼 기술 관리자 리 우 리핑: 바이 큰 데이터 플랫폼 소개
PPT 다운로드-BDTC 2012의 여섯 번째 세션
Liu 리핑은 주로 기술과 바이, 자체 데이터 웨어하우스 및 여러 분석 엔진 분석에 초점을 맞추고의 대용량 데이터 플랫폼의 응용 프로그램을 소개 합니다. 하이브 데이터 웨어하우스, 현재 중요 한 일, 첫 번째, 데이터 질감에 따라 콘텐츠 보다 크면 테마, 맨 손으로 금속, 물리적 저장소, 등, 전체 모델을 설정 하는 플랫폼, 어떤 상황을 고려 하는 것을 줄이기 위해, 어떻게 하지 이러한 문제; 보호할 것 이다 데이터 웨어하우스 뒤 우리가 할 필요가 데이터 콘텐츠 수준에 대 한 작업, 데이터 범위를 개선 하 고 저장소의 전체 회사, 데이터 모델의 참조 지속적으로 완성, 구축, 응용 프로그램 지향 현장 데이터 모델을 건설 한다.
Qihoo 360 기술 관리자 Zhao Jianbo: Qihoo 360 향상 및 최고 큰 규모 hbase 클러스터의 개선
PPT 다운로드-BDTC 2013의 일곱 번째 세션
자세하게에서 만든 개선에 마지막 년 hbase Qihoo 360의 7 측면에 Zhao Jianbo 초점: 독점 metaserver, 시작 최적화, 스캔, 압축, 보호 모드, 클라이언트 시간 제한 보증, 인덱스 미리. 경험에 따르면 Qihoo 360 hbase, 그 4 유용한 제안 했다: 영역을 만드는 사전, 수와 지역의 크기를 제어 하 고 타이밍 및 압축의 데이터를 제어 하: 낮은 피크 동작 하 고 반복적인 IO를 방지 지역 상태 실시간으로 모니터링 하 고 메타와 서버 일관성 유지. 미래에 hbase 인덱싱, 레벨 2 읽기 최적화 (읽기 데이터의 양을 줄이는), 지역, 무작위의 숫자를 줄이는 및 서비스 가용성을 개선 하는 사업을 결합 하 여 계속 됩니다.
Cai Yudong, NetEase의 수석 매니저: 대규모 콘텐츠 추천 시스템의 연습
PPT 다운로드-BDTC 2012의 여섯 번째 세션
Cai Yudong 소개 기술 NetEase의 큰 콘텐츠 추천의 선택은 주로 두 종류는: 추천 시스템 (사용자 및 개체 모델링, 상품과 유사성의 사용자 모델의 계산 및 사용자에 게 권장 하는 개체의 가장 높은 유사성의 사용자의 모델)의 내용에 따라 이다; 다른 (관련이 없는 시스템의 비즈니스 협업 필터링 기반 추천 시스템 유사성에 따라 사용자의 액세스 레코드 채굴 된다. 다양 한 선택에 따라 회사는 마지막으로 뉴스 추천 (내용 기반 추천), 아틀라스 및 비디오 추천 (협업 필터링 권장 사항에 따라)를 선택. Cai Yudong는 또한 기술 구현 방법, 사용자의 관심 밖, 사용자의 관심 모델 사용 하 둡, 하이브 데이터 마이닝 도구로 포털 사용자 액세스 로그에서 자세히 설명 합니다.
초침 기술 관리자 리 우 청중: PostgreSQL에 Runningcloudera 임 팔 라
PPT 다운로드-BDTC 2013의 일곱 번째 세션
Liu 청중 초침 큰 데이터에 초점을 맞추고 하 고 큰 데이터를 탐구 하는 이유를 설명 합니다. 그는 말했다 프로젝트 카마 개발, 주로 Cloudera 임 팔 라를 고려에 대 한 근거로 Cloudera 임 팔 라의 원래 선택 다음과 같은 이점이 있습니다: 더 코드, 분명 모듈, 쉽게 사용자 정의 Hadoop 분산된 실행 트리 보다 더 빨리 등등. 다음, 그는에서 프런트 엔드, 백 엔드, 카마를 소개 하 고 등등 카마로 성능, 인덱스, 다중 사용자 쿼리의 데이터를 제공. 결국, 그에 사 통합, UDF 등 카마 미래 기능 전망, 가져왔다, 그것 가치가 기대.
거 대 한 전나무 데이터베이스 CTO 왕 타오: 비-관계형 데이터베이스 SQL 실행에 따라 엔진 Cloudera 임 팔 라
PPT 다운로드-BDTC 2013의 일곱 번째 세션
왕 타오 도입 임 팔 라 연습: SEQUOIADB는 문서 클래스의 NoSQL 데이터베이스, Sequoiasql은 SQL 실행 엔진 개발된 기반된 오픈 소스 프로젝트 Cloudera 임 팔 라. Sequoiasql 그냥 "sql-에-하 둡" 아니다, JDBC, 호환 하이브 드라이브, 향상 된 기능에 대 한 다음과 같은 4 포인트 Cloudera 임 팔 라에 비해 지원: 가입 SEQUOIADB 및 읽기 / 쓰기 인터페이스의 관계형 데이터베이스 Metastore SEQUOIADB, 업데이트/삭제/병합 문을 추가, 조건자 압력, 쿼리 및 데이터베이스 인덱스와 성능 향상에 포함. 테스트 데이터는 sequoiasql 하이브 성능 보다 최대 10 배까지 시간을 얻을 수 있습니다 보여줍니다. 마지막으로, 그는 향후 제품 계획, 아래로, 아래로, 중첩된 형식에 대 한 지원, 배열 형식, 그리고 궁극적으로 비용 기반 성능 최적화에 대 한 지원을 정렬 집계에 대 한 지원 등을 공유.
컴퓨터, 제품 관리 감독의 핵심 기술 청: Hadoop 호위에 대 한 데이터 통합
PPT 다운로드-BDTC 2012의 여섯 번째 세션
청 그 큰 데이터를 사용 하 여 수 두 가지 혁신, 비용 절감. 혁신 우리의 삶과 작품에 대 한 큰 데이터를 사용 하 여 다른 기업 사용 하는 것입니다, 그리고 사기 탐지, 위험, 포트폴리오 분석, 투자 추천, 실시간 데이터 감사, 사전 유지 보수 유지 보수, 유전자 시퀀싱, 상호 차량 및 다른 혁신에 대 한 큰 데이터를 사용할 수 있습니다. 비용을 줄이기 위해 여러 가지 방법이 있다: 원시 데이터를 일시적으로 저가 상용 하드웨어에 저장할 수 있습니다, Etl/elt 처리 전송 실시간 데이터 통합, 저가 상용 하드웨어 ETL 처리, 고속 데이터 복제의 매끄러운 구현 소스 시스템에서 제거 처리; 최대 두 번 시간, 개발자 생산성 증가 수 어디 하나 개발 하 여 배포할 데이터 복제본을 제거 하 고 데이터 웨어하우스 데이터 관리 비용을 줄이기 위해 데이터 가상화를 통해 기능을 증가. 청 절충 한 큰 데이터의 혁신과 비용 절감을 가리킵니다.
금성 첸 회사 부사장, 수석 전략 책임자 팬 Juting: 공격 하는 큰 데이터
PPT 다운로드-BDTC 2012의 여섯 번째 세션
보안 및 개인 정보 보호 큰 데이터의 영원한 문제 이며 데이터 증가 함에 따라 조직에 직면 하는 주요 위험에 걸쳐 복잡 한 위협 및 데이터 보호의 전통적인 방법은 종종 맞지 더 많은 준수 요구 사항을 준수 하. 우리 큰 데이터의 보안을 고려해 생각 하는 보안을 사용 하는 법을 배워야, 포함 하는 세 가지 요소 (자산, 위협 및 보안 조치) 위치 (게임, 대결, 협력, 값은 속성, 의도 그리고 임의 방해), 공간 및 지식 (유통 및 계층, 수명 주기, 흐름 및 사용 사례, 지식 차원 클러스터) 및 고아 한 방법 (인증 된 암호화 클래스, 공격 탐지 클래스, 체계적인 위험 관리 클래스입니다. 큰 데이터 공격 시스템 평면, 서비스 플레인 및 데이터 플레인의 세 가지 측면에서 주로 고 자세한 소개에 실시 하고있다 팬 Juting
2014 년 12 월 12-14, 여는 중국 컴퓨터 학회 (CCF), CCF 큰 데이터 전문가 위원회, 후원 CSDN 과학의 중국 아카데미 공동 주최 첫 번째 중국 대형 데이터 기술 컨퍼런스 (다 데이터 기술 컨퍼런스 2014 BDTC 2014) 베이징 새로운 운 크라운 플라자 그랜드 호텔에서 개최 됩니다. 이 의회에 주안점 "큰 데이터 인프라", "큰 데이터 생태계,"대용량 데이터 핵심 기술","큰 데이터 응용 프로그램의 인터넷 기술 연습"," 전통적인 엔터프라이즈 기술의 큰 데이터 응용 "그리고 다른 문제는, 거의 백 전문가 공유 그들의 기술 전투 현장 방문 한다. 더 많은 양보를, 속도를 등록!
중국 대형 데이터 기술 회의 PPT 컬렉션 시리즈 기사:
BDTC ppt 모음 (i): 박쥐, 화 웨이, NetEase와 다른 큰-공유 데이터 아키텍처
BDTC ppt 모음 (ii): 페이 스 북, 링크 드 인, 등등에 의해 공유 하는 큰 데이터 아키텍처.
BDTC ppt 모음 (iii): 박쥐, IBM, 인텔 공유 대용량 데이터 기술
무료 구독 "CSDN 클라우드 컴퓨팅 (왼쪽) 및 csdn 큰 데이터 (오른쪽)" 마이크로-편지 공개 번호, 실시간의 이해 원래 클라우드 뉴스, 최신 큰 데이터 진행을 이해 하기!
CSDN 게시 관련된 클라우드 가상화, 독 노동자, OpenStack, Cloudstack, 및 데이터 센터 등의 정보를 컴퓨팅, 스트림 컴퓨팅, 하 둡, Nosql/newsql, HBase, 임 팔 라, 스파크 메모리 계산, 공유 기계 학습 및 지능형 알고리즘 및 기타 큰 데이터 뷰를 제공 하는 클라우드 컴퓨팅 및 대형 데이터 기술, 플랫폼, 연습 및 산업 정보 서비스 관련.