지금 모바일 인터넷 및 IoT의 개발, 데이터 하지 생산 됩니다. 개별 사용자의 휴대 전화, 착용 장비 등을 포함 하 여 또한 산업 응용 센서, 감시 카메라와 기타 정보를 포함 합니다. 디지털화는 디지털 정보를 생산 하 고 많은 양의 디지털 세계를 병합 과정에서 데이터 축적으로 실제 세계와 현실 세계의 아날로그 정보를 변환 합니다. 모든 글로벌 정보 데이터의 90%는 지난 2 년 동안에 생성 됩니다. 2013 년에 일 당 25PB 데이터의 글로벌 세대 총 양의 1500 국립 도서관에 정보에 해당합니다. 글로벌 데이터 볼륨 2003 5EB, 2012 2.7ZB, 급속 한 성장에서에서 40ZB에 도달 하는 2020에 있을 것입니다. 이러한 수치는 종종 그들의 엄청난 가치에 대 한 물 아래 숨겨져 있는 바다에 떠 있는 빙산에 비유 됩니다.
총회에서 첸 샹로 생산 하는 모든 데이터는 원래의 목적, 그리고 그들의 첫 번째 값, 그리고 이러한 데이터는 신속 하 게 축적 하 고, 그들은 것 이다 두 번째 생산, 3 값. 효과적인 기술을 발견 하 고 발굴 해야 합니다. 예를 들어, 온라인 앨범, 첫 번째 값 스토리지 서비스와 사용자를 제공 하기입니다. 우리가 더 많은 사진을, 우리가 유행 색상을 찾을 하 고도 미래 트렌드를 예측할 수 있습니다. 예를 들어 착용 장비는 24 시간 우리의 신체를 모니터링할 수 있습니다, 그리고 첫 번째 값은 기록 유행 단어, 그들의 신체 조건, "계량 자아". 하지만 우리가 오랜 시간에 대 한 데이터를 분석할 수 있습니다, 만약 우리가 건강 상황을 찾을 수 있습니다 및 조기 경보를 제공.
큰 데이터의 두 가지 중요 한 특성: 많은 양의 데이터, 급속 한 성장. 맥킨 지 보고서, 의료 데이터 일어날 것 이다 급격 하 게 35ZB를 2020 년까지, 99 번 2009 년에서 데이터의 양을 시간에 해당. 교통 데이터, 하루 지방 고속도로 비디오 감시 데이터 50T에 따르면. 이 데이터 생성은 또한 그것의 첫 번째 값을 있다. 의료 데이터는 환자입니다와 같은 비디오 감시 데이터 가늠 자입니다. 그들의 첫 번째 값은 악용 하면 데이터 일반적으로 보류. 점차적으로,이 데이터는 업계의 부담이 될. 하지만 사실, 이러한 수치는 여전히 귀중 한 가치 있다. 숨기고이 데이터의 값을 검색 하는 방법 중 업계에서 문제 되고있다.
빙산의 가치에 그들의 자신의 데이터, 얼굴 데이터 마이닝의 값에 다양 한 산업은 몇 가지 실용적인 작업을 했다. 그의 연설에서 첸 샹 기업 연습에 몇 가지 오해를 정리. 많은 전통 산업은 작은 데이터 개발 및 활용, 작은 데이터 하지, 완전 한 종합적이 고 체계적인 대용량 데이터 성격을 포함 하는 큰 데이터를 여전히 제한 됩니다. 전통적인 데이터 처리 방법 및 대용량 데이터 기술, 기술을 거기는 더 큰 데이터 시대에 대해 가져온 새로운 기능. 이 시점에서 전통적인 산업 큰 데이터의 특성, 새로운 도구 및 데이터 크기, 복잡 한 구조와 수요의 고속 확장에 맞게 새로운 플랫폼의 개발을 볼 필요가 있다. 따라서, 전통적인 산업 큰 데이터 기술 및 능력 광산 업계 데이터의 새 값을 필요로 한다.
어떻게 합니까 바이 활용할 데이터 빙산의 값? 첸 샹 몇 가지 흥미로운 예제. 바이 두 검색 엔진으로 정보, 사람을 연결 하 고 자연스럽 게 큰 데이터 회사 이다. 먼저 검색 엔진으로 바이 인터넷에서 데이터를 수집 해야 합니다. 위해서는 많은 수의 다른 구조의 텍스트, 사진, 오디오 및 비디오 데이터에 저장 되는 정보를 검색 하는 사람들을 용이 하 게. 처럼 우리는 키워드를 검색 하기 전에 결과 단조로운 링크입니다. 관련 동영상을 체크 하지만 또한 다른 검색 해야 합니다. 자, 바이 콜 "기술 지도" 결과 결과로 이러한 서로 다른 유형의 네트워크 데이터를 연결할 자체 데이터 마이닝 및 인공 지능 기술을 사용 하는. 예를 들어 지금 바이 두 검색 "중국 좋은 목소리"를 사용 하 여, 결과 프로그램의 설명만,가 수, 노래, 유사 프로그램과 다른 결과. 같은 검색, 작가 눈 밝은 게 정보 디스플레이의 다양 한 형태를 제공 합니다.
같은 시간에 사용자의 검색 행동 정보, 바이 떠나 고을 수행 하는 다음 큰 데이터 관련 분석, 군중 초상화에 대 한 그 관심 포인트, 특성 및 다른 새로운 정보를 차례로 승격 될 수 있습니다 가장 관련성이 높은 정보를 찾기 위해 우리의 네티즌에 대 한 수천에서 발견. 이것은 바이 신안 이다. 광고의 결과 사용자 검색 키워드 광고 보다 효과적인 바이 광고에 넣어 사이 상관 관계가 있다. 미래에 대 한 바이 자체 인공 지능 기술을 사용 하 여 바이 예보를 시작, 관광 도시, 관광 명소, 열, 예측 전문가, 대학 예측의 대학 입학 시험이 있다. 바이 두의 월드컵 브라질 원 웹사이트--에 예측, 하자 기다려을 보고 참조 하십시오.
바이 빙산, 금광에서 큰 데이터 자원을 밖으로 파고 들어 기술을 사용 합니다. 마지막으로, 큰 데이터의 개발 데이터 마이닝의 새로운 단계에 진입 했다, 첸 샹 말했다. 바이 "빅 데이터 엔진으로 바이 대 한"이 큰 데이터 기술 패키지는 산업 사회까지 여. 큰 데이터 엔진의 플랫폼을 사용 하 여, 산업 데이터의 새 값을 마이닝, 산업 업그레이드를 돕는 큰 데이터의 특성에 따라 전통 산업을 도움이 됩니다.