1, 백그라운드의 존재
인프라에 거 대 한 도약, 데이터 저장 기술 및 네트워크 기술의 급속 한 발전 큰 데이터 나이의 도착을 위한 소재 재단을 준비 했습니다.
사물의 인터넷은 본질적으로 더 많은 포털 및 데이터 수집, 그리고 클라우드 컴퓨팅 서비스 및 장치 컴퓨팅 및 스토리지 비용을 줄이기 위해 중앙된 건설의 비즈니스 모델을 육성의 노드. 모바일 인터넷은 훨씬 더 흥미로운: 첫 번째는 적절 한 시기, 적절 한 장소, 바로 사람에 게 적당 한 정보에는 id, 알아야 귀하의 파트너는, 그가 좋아하는, 그는 지금이 정확한 id 정보 없이 어떤 상태 모든 것 들에 대해 이야기 하는. 두 번째는 연결, 네트워크와의 양방향 적시 대화형 연결, 당신은 어떤 정보를 컴퓨터에서. 1 반 우리 정보 외에, 우리는 다른 정보의 절반 이지만 변경 정보 흐름 더 적시 될 수 있습니다. 세 번째는 휴대 전화의 주요 특징, 정보는 위치 특성. 마지막으로 유도 우리 컴퓨터에 없는 더 많은 센서를가지고, 휴대 전화 센서 각도 더 있을 것 이며, 더, 착용 할 수 있는 제품, 휴대 전화의 미래 맛 냄새를 맡을 수, 초과, 포름알데히드를 느낄 수 있다 전자기 방사선을 느낄 수 있습니다. 이 세 가지의 결합은 기본적으로 생산, 처리 및 큰 데이터를 통해 새로운 기술 및 다양 한 문제, 정보 흐름, 자본 흐름, 물류의 개조를 해결할 수 있도록 다양 한 적용.
2. 데이터 얼마나 큽니까?
큰 데이터 기반 방법론의 방법론에 변화는 본질적으로 인간 행동 점점 가상화, 과거의 역사에서 아무도 알고 인터넷에 사람 인지 이제 사방 개 추적 사방, 언어 분석, 자연 의미 처리, 이미지 처리, 신호 처리, 정확 하 게 예측, 관계 예측 결과 2 년 마다 두 배로 글로벌 데이터 볼륨에. 아이폰과 안 드 로이드 인기의 모든 종류, 구름에서 누구나 몇 G T는 여러 다양 한 정보를 어느 정도 큰 네트워크 디스크 수와 거래를 하지, 대용량 데이터의 좁은 의미 라고. 새 컴퓨터를 처리, 저장, 및 춥고 뜨거운 데이터 액세스 빈도에 따라 나뉘어 데이터 분석 수학적 모델링을 많이 있다. 열 데이터에 대 한 가져온 정보의 양을 더 중요 한, 초점, 했다 이었고 수학적 접근 통계 샘플링에 근거 했다. 매혹적인 상관 관계: 하지만 컴퓨팅 및 스토리지의 비용 감소, 그것은 발견 데이터의 총 금액을 처리할 수 있는, 데이터 축적의 전액 멋진 현상이 많이 되었습니다. 일부는 현재의 과학에 큰 영향을 미칠 그리고 통계 및 샘플링 기반 모델은 케이프 타운 법과 명왕성의 실수 같은 잘못 될 가능성이 높습니다. 이것은 저와 서의 역사적 기회의 빅 데이터 시대를 참조할 수 있습니다. 그래서 좁은 정의에 4 V 빠른 IBM와 IDC, 데이터 규모 (양), 정의 (속도), 여러 유형 (다양 한) 값 (값) 될 것입니다.
3. 왜 그렇게 깜짝 놀랄만한 큰 데이터는? 내가 생각 하는 깊은 사회적 배경, 더 중요 한 것은 데이터 생각
첫 번째는 내가 생각 하 고, 생각 무작위 샘플링 보다 데이터의 포괄 주의 하 소위 데이터 데이터 언급 되어 있다 이다. 둘째: 데이터의 복잡성에 초점, 정확도, 우리는 많은 사람들이 하나의 질문 하기 전에 약화는 하나,이 시, 지금 우리 안에 큰 데이터 너무 정제 된, 우리는 큰 프레임 워크, 퍼지 정확도 추세 판단 3 번째로 큰 데이터는 비즈니스 모델을 평가 하는 새로운 방법의 필요 요구 하지 않습니다. 데이터 핵심 자산 된다 뿌리깊은 엔터프라이즈의 비즈니스 모델에 영향을 미칠 하 고 심지어 그것의 문화 및 조직 재구성 됩니다.
5 차원 정의 했습니다: 활동, 단위, 차원 공간, 감정 처음 전화 활동, 인터넷 회사에 기본적으로 당신이 예를 들어 당신이 알리 서비스를 사용 하 여, 3 5 번 하루, 하지만 당신이 알고 한 달 또는 더 많은 시간을 이동 될 수 있습니다 네트워크의 은행을 사용할 수 있습니다. 두 번째 입자 크기 라고, 그것은 당신이 전기 대리점에 당신이 게에 쇼핑, 형태로 구입, 물류, 수송, 분포, 최종 평가 하는 링크를 공유, 모든 완전히 레코드, 당신에 게 이것은 매우 중요 한의 플랫폼에, 세분성, 전화 정보 데이터 또는 재무 데이터를 우리 은행에서 볼 수 있다 물, 전기 및 가스 비용 플러스 급여 날짜,이 데이터는 매우 거친. 3 차원, Yeepay 지불 같은 이라고 그리고 그의 데이터를 사용 하면 데이터, 그와 함께 유지 하는 데이터 관련 처리 및 분석에 대 한 더 많은 차원이 있다 그래서. 4의 거리입니다. 때 누군가가 대출 요구 사항, 내 금융기관, 인터넷 회사, 요구, 또는 알고 때 온라인, 대출을 알고 먼저 될 것입니다 수 있습니다 난 처음으로이 고객, 은행 과정에서 많은 있다는 것을 알고, 이것은,이 근처 이며 멀리. 지난번 우리 전화 감정, Weibo에 보내는 모든 메시지 감정, 감정, 그리고 당신이 그것을 알고 후 상태 어떤 마케팅을 유용 하지 않습니다 알고.
4. 어떻게 다음 합니까? -팬-인터넷
소프트웨어, 하드웨어 가져오기 산업 수직 통합의 데이터 컬렉션으로 무료 있을 것입니다: 첫 번째는 하드웨어를 할 수 있는 소프트웨어, 하드웨어 및 소프트웨어 인터넷 기업이 할 다음은 전기 사업을 할 금융, 금융 할 전기, 부가가치 서비스를 제공 하기 위해 소프트웨어 회사. 왜? 일단 해야 고객에 게 무선 근접, 그것은 모든 고객의 요구를 게재 하 고 업계의 경계는 지속적으로 자산으로 깨진 되: 데이터 더 중요 한 되 고 모든 비즈니스 모델의 기원과 리팩토링의 기초입니다.
5. 중국에서 국제적인 맥락에서이 변화가 일어나
인터넷 산업은 첫 번째, 비즈니스 인텔리전스 및 컨설팅 서비스, 소매 업계, 하지만 또한 의료, 건강, 교통, 물류 및 심지어 생명 공학, 천문학... 인식 및 데이터 서비스, 대용량 데이터에 의해 양산 능력 사회, 보건 의료, 정부, 교육, 경제, 인문 및 사회의 다른 지역에 상업 기술에서의 모든 측면에 영향을 하 고 모든 분야에서 transformative 힘 양산. 우리는 트랜스-국경 부르는 파괴. 엔터프라이즈 수준 및 혁신 시장에 큰 데이터 기술을 나눕니다. 엔터프라이즈 수준의 시장 또한 IBM, EMC, HP, 새로운 병의 오래 된 와인, 오라클과의 비즈니스 인텔리전스 데이터 처리, 데이터 분석 수행에 트릭 고객에 게 더 간단 하 게 오래 된 제품의 교체 이다. 그 당시 다른 한편으로, Google\facebook, 국내 박쥐 등 등은 정말 고려 하 고 큰 데이터. 과 알리 IOE, 추세에 아니라도 모바일 및 대형 데이터 파의 미래에 반영 외국인의 제품 국내 급속 한, 오픈 소스, 편리한 성장 요구를 충족 하지 않을 수 있습니다. 빅 데이터 기술 혁신 시장에서: 한편으로, 주로 오픈 소스. 심지어 IBM, Oracle 및 다른 산업 거 인은 또한 통합 된 오픈 소스 기술, 그리고 회사의 원래 제품 더 나은 조합, 신흥 대형 데이터 처리 분야, 중국에서에서 외국 회사는 거의 같은 출발선에 서 서. 대규모 데이터 처리 기술 (예: Hadoop MapReduce, 패턴 인식, 기계 학습, 등)의 좁은 의미에서 중국과 외국 사이의 간격이 매우 짧습니다. 디지털 자산 및 기술 사용의 크기를 고려 하면, 중국과 외국 사이의 격차는 더 의식의 차이에 반영 됩니다. 알리 처럼 완전히 그들의 자신의 사용을 위한 뿐만 아니라 현재 IoE 제품 교체는 하지만 또한 Aliyun 외부 출력을 제공 합니다. 아마존 e c 2와 S3으로 바뀌고 더 큰 이익 포인트 처럼 지출, 그것의 2 십억을 저장 합니다. 지금의 용량을 처리 하는 알리와 초당 100 백만 번, 다른 손에, 중국의 인구와 경제 크기에, 합성 (절벽의 사람들의 은행에서 지난 몇 일 동안에서 엄마 윤)의 4 개 이상의 주요 라인 세계에서 크라운 중국의 데이터 자산의 크기를 결정. 객관적으로 대용량 데이터 기술 개발에 대 한 드릴 필드를 제공합니다. 예를 들어 난 Oracle에서 3 주 전에 컨설팅 관리자의 연산자, 각각 발생 하는 고객은 언급 하는 고객, 우리는 데이터의 세계에서 가장 큰 수 있습니다. 사격의 명 수는 글머리 기호에 의해 연마 하 고 좋은 제품 데이터에 의해 측정 됩니다. 알리, Jingdong, 바이 관련 회사, 고객 수요 구동, 또는 비용 기반 교체 과정을 시작 했습니다, 여부이 동향 더 금융, 통신, 정부 및 다른 중요 한 IT 투자 산업 전송 될 것입니다 생각.
6, 몇 가지 전형적인 회사의 큰 데이터
Baidu는 중국의 가장 큰 소비자 행동 데이터베이스, 중국 네티즌, 일일 요청 응답을 5 십억 검색의 95%를 덮고, 검색 시장 비율인 80%, 바이 얼라이언스, 600000 얼라이언스 파트너 매일 5 십억 번 매일 행동, 거 대 한 데이터의 기초를 창설 하는. 모드 변경: 푸시 바이 색인, 및 바이 색인 바이 구름 목록, 바이 데이터 센터의 설립에 따라 연구 방법 네트워크 검색 자문 보고서의 기관. 광고 웹 마 스 터와 개발 팀 바이 (모바일) 통계 및 관련된 개발자 서비스 도구 제공합니다.
Tencent은 783.6 백만 이상의 QQ 활성 계정, 469 백만 microblogging 사용자와 비디오 사용자, 597.6 백만 QQ 공간 사용자, 마이크로-편지, 휴대 전화 버틀러와 다른 모바일 사용자도 이상의 400 백만, 해외 사용자 100 백만 보다는 더 빠른의 100 백만 이상 이다. 대량 사용자, Tencent "N 제품 xn 플랫폼 xn xn 터미널 사용자 관계"를 제외 하 고 거 대 한 서비스 매트릭스, 데이터 구조화의 대량 조각. 유일한 도구는: Tencent 분석과 Tencent 나침반.
Ma는 플랫폼, 금융 및 데이터는 알리의 3 개의 전략적 방향 미래에 말했다. 알리 미래는 기본적으로 데이터 회사, 전기 사업은 점점 데이터에서 분리, 재무의 핵심 또한 데이터. 인수 시 나 Weibo, 리그의 친구의 금, 틴 틴, 등은 데이터의 원형에 대 한. 난 관련의 일 들 수백 번, 자세히 살포 했습니다. 담당자: 차 느낌, 재미 있는 제품: 내부 Amoy 데이터, KPI 시스템, 데이터 포털, 라이브 방송, 판매자 클라우드 페이지 클릭, 황 Jinze; 데이터 큐브, 무한 한 하나님 바늘 클래스 360와 고객을 제공, Taobao 가장 획기적인 2012 알리 색인을 "폴 리 석 탑" 시작 제품 제공할 수 있습니다 데이터 저장, 데이터 계산 서비스의 두 종류가 19.1 십억 달러 큰 승진 일 평소 보다 20 배 배 증가 "폴 리 석 탑" 처리 명령 보다 고양이 20%, 총 수 보다 2012 년 "더블 11". 알리 금융 큰 데이터 파생 제품 개발의 예입니다. 알리 전기 몫 특성 때문에 그 응용 프로그램에 더 간다.
7. 분류 및 산업 체인의 규모
관련된 기본 산업, 첫째, 지능형 파이프라인, IoT, 서버, 스토리지, 전송, 지능형 모바일 디바이스, 소프트웨어, 언어, 데이터 플랫폼, 도구, 구조와 구조화 되지 않은 데이터베이스, 응용 프로그램 소프트웨어, 등, 서비스, IDC, 클라우드 컴퓨팅, 웹 응용 프로그램, 등의 하드웨어를 포함 하 여 데이터 기술 산업의 많은 있다. 두 번째는 데이터 수집, 위치를 포함 하 여, 결제, SNS, 메일 및 다른 산업, 세 번째는 정보 산업, 데이터 마이닝, 데이터 분석, 데이터 컨설팅 및 다른 산업;를 포함 하 여 데이터 응용 산업: 예를 들어 인터넷을 기반으로 금융 데이터 생성에 따라.
8, 대용량 데이터의 요약:
생각: 데이터 생각
두 가지 주요 푸시: 극단적인 경험, 긴 꼬리 효과
세 가지 주요 동향: 팬-인터넷, 수직 통합, 데이터는 자산
4 단계: 항목, 흐름, 데이터, 현금
5 표준: 활동, 단위, 차원, 시간 및 공간, 감정
6 주요 모델: 데이터, 정보, 컨설팅, 미디어, 데이터, 기술
7 단어: 초점, 궁극,의 단어-입, 빠른
(책임 편집기: Mengyishan)