지구 어디에서 돌을 선택 하 고 철 분 요소를 확인하실 수 있습니다. 하지만 말도 안 되는 세계 철 광 석에 가득 말을 해야 합니다. 경우에 일정 비율을 초과 하는 돌의 철제 내용 돌의 수에 도달 하면 상당한 규모, 바위 철 광 석, 불릴 수 있다 그리고 사람들은 광업에 있는 그것의 투자에 관심이 있을 것 이다. 철 광 석 매장 되지 않은 경우 너무 깊이, 광업 및 수송의 비용은 너무 높은 시장 장기적이 고 안정적인 구매 수요는, 철 광 석 광산의 관심 작업, 수익성 있는 사업 활동을 될 것입니다.
동일한 원리는 대용량 데이터의 근원의 분석에 적용 됩니다. 인터넷, 네트워크 데이터입니다. 인터넷 사용자와 점점 더 풍부한 네트워크 서비스의 증가 함께 네트워크 데이터 농축 것입니다. 일부 서비스는 위에 나열 된 웹 사이트, 여부 그들은 뉴스 정보, 제품 제품, 또는 엔터테인먼트 게임, 사용자가 서비스 공급자에 액세스할으로 서 일부 사용 하 여 레코드를 떠날 것 이다. 아무리 간단 하 고 격리 된 데이터는, 사용자 ID와 클릭 사용할 수 있는 비즈니스 모델을 지원 될 수 있는 광고 네트워크. 사용자 등록 정보 및 지불 계정, 만큼 전자 상거래 및 회원 서비스 비즈니스 모델을 지원할 수 있습니다. 새로운 네트워크 사용자의 감소와 동질성 네트워크 서비스의 증가, 네트워크 서비스 제공 업체 되 정밀한 작업에 광범위 한 작업에서 시작 하 고 소득 향상 및 시장 승진의 입력-출력 비율을 개선 하 여 이익을 하려고. 세심 한 관리로 다양 한 노력에서 일반적으로 사용 되는 수단 중 하나는 데이터 마이닝 이다.
과거에는, 대부분 인터넷 회사 제품 및 서비스를 중심으로 했다로 그래서 우리가 무엇을 얻을 기본적으로 단일 제품 및 사용자, 제품 간, 사용자, 그리고 더 복잡 한 제품 논리와 사용자 행동 논리는 일반적으로 업계에 알려져 구조화, 구조화 되지 않은, 또는 조각난 데이터 간의 데이터의 부족 사이 동작의 기록. 그래서 비록 데이터 통합 및 분석, 거기에 회사의 전문가 중 일부는 일부 전문된 데이터 마이닝 회사, 도구 및 전문 서비스, 하지만 전체 모양, 데이터 수집, 데이터 정렬, 마이닝 비용 및 결과 혜택, 비용에 비해 덜 매력적. 불 쌍 한 철 광 석의 경우, 골드 콘텐츠 음식 맛도, 삭제, 닭고기와 함께 또한 모양 하지만 얼마나 깊이 파고, 얼마나 큰 규모에 상관 없이 높은 되지 않습니다.
WEB2.0 시대 상황이 근본적으로 변화 했다. 예를 들어 얼마나 큰 데이터 형성 자체 일상 서비스에서 볼 수 있는 페이 스 북,: 첫째, 사용자가 사용할 수,이 등록 ID는 (페이스 북의 연결), 사이트의 수백만의 수만에서 사용할 수 있습니다 또한 제 3 자 응용 프로그램 (오픈의 수백만에 게 등록을 해야 플랫폼)입니다. 이 확실성 및 사용자 id의 고유성을 구성합니다. 둘째, 사용자와 사용자 간의 직접 및 간접적인 상호 작용 구성 동적, 안정, 끊임없이 변화 하 고 소셜 네트워크, 정보 및 제품 및 서비스 홍보, 컨텍스트를의 보급의 개발 구조. 셋째, 많은 일반적인 표준 및 오픈 플랫폼의 인터페이스 균일 한 데이터 형식, 구조 및 논리를 사용 하 여 비교적 간단 하 고 쉽게 융합과 통합 데이터의 확인을 제 3 자 응용 프로그램 공급자의 많은 수를 유도. 마지막으로, 웹 아키텍처 (예: 벽 및 Newfeed)의 단순 복잡 한 사회 데이터는 데이터 정렬 및 분석을 촉진 하기 위하여 형성 될 수 있도록 많은 플랫폼 기능에 의해 생성 된 데이터의 자동 결합 수 있습니다. 5, 타임 라인, opengraph, 신용 하 고 그래서 메커니즘의 일련에 혼합 될 것, 복잡 한 사용자 네트워크 동작 통합 공간 논리 명확 하 고, 행동 논리 수 동작 데이터 체인 체크. 이 모든 페이스 북 의식적으로 또는 무의식적으로 된 큰 데이터를 생성 하는 웹 업계에서 첫 번째 회사. 물론, 이것은 큰 데이터 생성의 유일한 형태는 것 또는 그것은 분석을 위한 대용량 데이터를 사용 하 여 성공 했다 말할 수 없습니다.
그냥 큰 데이터 소유 및 소비자 회사 되 고 있는 페이스 북이 아니다. 애플은 운영 체제와 네트워크 단말기 형태로 큰 데이터 생성에 노력 하 고 있다, 운영 체제, 검색 시스템 및 Google + 플랫폼에서 Google 제품의 번호를 통합 하려고 하는, 네트워크 플랫폼을 통해 대형 및 사용 가능한 데이터, 아마존의 형성은 클라우드 컴퓨팅 플랫폼 및 큰 데이터 컬렉션 터미널 형태를 읽고 전자 상거래의 수직 필드에 놓습니다. 국내 인터넷 기업 중 일부는 의도적으로 또는 실수로, 노력, 클라우드 컴퓨팅 등의 일부 낮은 수준에서 입력 방법, 브라우저, 바이러스 백신 플랫폼으로 다양 한 트로이 목마, 쿠키 및 다른 것 들, 취득 하 고 더 많은 사용자 동작 데이터를 통합 하려고. 한마디로, 데이터 구조 향상, 데이터 관계를 증가, 통합 하 고 다양 한 방법으로 조각난된 데이터 활용 산업 발전의 중요 한 추세입니다.
마찬가지로 지금까지 업계에 관한 네트워크 산업 빅 데이터 시대의 초기 단계입니다. 사업에 큰 데이터에 대 한 의존도의 정도 하 고 운영 수준, 검색, 이외에 일반적으로 통신, 금융, 증권, 보험, 항공 및 호텔 등 전통적인 산업의 수준 보다 낮은. 그러나, 네트워크 산업의 게시물 이점을 매우 분명 하다. 다른 전통적인 산업의 인터넷 일상 업무와 생활의 대부분의 사용자가 인터넷에 더 의존, 네트워크 산업, 다양 한 산업, 종합적이 고 체계적인 기록 하 고 35 년 동안에서 큰 데이터 시스템의 행동 패턴의 사용자의 수백만의 수백의 이해의 통합에 의해 최고의 것입니다 프로토 타입, 거 대 한 누가 첫 번째 위치, 사실 표준의 도입, 새로운 서비스 모델 및 비즈니스 모델의 개발을 잡을 것입니다에 관해서는 업계, 노력, 재산의 이해를 볼 필요가 있다.
(책임 편집기: 유산의 좋은)