때문에 대용량 데이터의 개념은 등장 하지 이해의 개념을 그들은에 종사 하는 IT 담당자, 주요 소프트웨어 회사는 더 많은 분야에 참여 인정 당황 될 것을, 바이러스 처럼 확산 하고있다. 내가 생각 하는 내가 종사 오랜 시간에 대 한 데이터 처리 작업에는 프로세스의 작업: 자신의 인터페이스 (FTP)의 파일 (예: CSV 형식, XML 형식, 심지어 바이너리 파일 포함), 다양 한 종류를 인터페이스에서 제공 하는 연산자 파일을 구문 분석 하 고 데이터베이스에 필요한 정보를 로드, 저장, 후 일부 데이터는 시간 단위 또는 공간 집계 처리에 대 한 것; 다음, 나를 위해, 나무는 다음, 거기 것 상단 인터페이스의 개발에 대 한 사람들의 다른 그룹 데이터베이스에 원래 데이터 또는 집계 된 데이터 이 정보를 표시 하 고 고객에 게 제공 하는 멋진 인터페이스를 만듭니다.
데이터를 처리의 양을 증가 하 고 계속 증가 하는 추세 일 것 이다 때문에 실시간 데이터 수집, 처리의 효율성 (일반 데이터 생성 매 시간 하나 한 시간에 처리 완료할 수 없습니다, 만약 특정 요구 사항을 할 필요가 있기 때문에 큰 데이터 관련 기술, 홍보 하는 이유 결과 생각할 수 있는)입니다. 이러한 이유로, Hadoop 등 큰 데이터 관련 기술 소개. 그러나,이 유일한 차이점은, 단순히 변경 하 여 데이터 처리 부분 원래 프로그램에서 "하이테크" 방법에, 유일한 차이점은을 집계 결과 직접 가져오고 데이터베이스에 그들을 가져올. 처리 후, 관련 데이터는 역사적 임무를 완료 것입니다 및 일정 시간 후에 "유골"
전설. 깊은 의심, 아마도 최고의 데이터 볼륨이 큰 데이터는 큰 데이터입니다.
사실상, 작업 후, 전설적인 "빅 데이터", 발견이 아니다, 그것은 생각의 새로운 모드, 데이터의 크기와도 자체 관계가 없습니다 한 푼도 공부 했다. 같은 시간에 같은 편안한 작업 환경에서 오랜 시간 그들은 밖으로 일부을 할 깊이 느꼈다. 어쩌면 충전 하 고 완전히 자신을 업그레이 드 하는 시간 이다.
그러나, 습관의 많은 년간, 있다 항상 카운터 권위, 하는 경향이 같은 자신의 방식 보다 완전 한 복사본의 모든 이론을 이해 하 고, 항상 그들의 자신의 이해, 그렇게 표현 하는 완전히 다른 방법에서 다음 텍스트를 같은 하. 이 성명에서이 작품은 순전히 엔터테인먼트, 일부 이러한 부분의 약간의 도움, 진정한 가치는 생각 하나; 공로 고려 또한 당신의 무형 문화 유산 될 수 있다면, 다음 당신의 소중한 시간을 낭비 하지 말고, 직접 무시 될 수 있습니다. 물론, 초보자 이기 때문에 있을 것입니다 일부 편차 또는 결함을 이해, 그래서 당신은 오신 것을 환영 합니다 "사무" 방식으로 학문적 인 면담을 실시 할 수 있다.
비즈니스의 볼륨 증가, 처리 하는 데이터의 양을 증가 하 고 해당 서버의 처리 용량을 개선 하는 물론. 지금 들어, 데이터 레코드, 수천의 10를 도달 하지 않는 경우 프로세스에 걸리는 시간 그것은 크게 무시할 수; 레코드 수천 수만의 처리를 위해 소비 하는 시간이 초에서 달성 될 수 있다 (물론, 이건 매우 큰), 100000 크기 순서, 처리 과정이 합리적, 만큼에 대 한 또한 가능성이 있다 수백만 배나의 분, 싸움의 과정은 충분히 합리적인 서버는 충분 한 전력, 그리고 소비 하는 시간 쾌활 범위 내 이며 수천만 배나 이면 최대 인 내에 대 한 필요성은 물론, 전제 이며 같은 처리 과정이 충분히 합리적인 힘; 충분히 서버 그것은 쾌활, 크기 순서 처리 불가능 때까지 증가 계속 됩니다.
아마도 어떤 사람은 전설적인 "빅 데이터"는 전통적인 기술을 달성할 수 없는 특정 숫자를 초과 하는 데이터의 양을 위해 주장할 것 이다. 그리고 실제로 그것은?
"빅 데이터" 호출할 수 있는 데이터의 양을 무엇 인가? 의사 제안 보인다, "얼마나 많은 머리카락으로 간주 되지 않습니다 대머리" 처럼, 명확한 답변 없이 질문 이다. 물론, 우리는 카운트의 100 보다 작은 머리는 대머리, 하지만 101 머리, 그것의 102을 생각할 수 있습니까? 얼마이 숫자 맞추기? 약간의 투쟁, 하지만 더 중요 한 것은, 그 경우에 사람에 숫자 대머리와 비-대머리, 누가 한 사람이 얼마나 많은 머리카락을 계산 하 여, 사이 분수령이 될 수 있는 경우에 머리 많이 없는. 같은 대용량 데이터에 대 한 사실 이다: 먼저, 정확한 값 또는 대용량 데이터의 구분선으로 사용할 수 있는 크기 순서 하 고 둘째, 사람들의 거 대 한 숫자, 누가 레코드, 레코드 번호의 무료 있을 것입니다.
사실, "큰 데이터"은 정확한 이름, 그것은 특정 현혹 자연. 소위 "빅 데이터"는 많은 양의 데이터, 하지만 그 데이터-거짓말을 하지 않습니다 "모든". 미래를 예측 하는 적절 한 규칙을 찾을 수 모든 데이터를 분석 하 여이 대용량 데이터의 기본 아이디어 이다.
빅터 마이어 Schoenberg, 그의 작품, "빅 데이터 시대", 생각, 빅 데이터 시대 3 변경할 필요가의 전통적인 모드 정리에서 수 큰 데이터 모드의 세 가지 아이디어를 생각 했다. 여기 개성, 또는 생각의이 라인을 따라 준비 하지입니다. 그러나, 우리는 여전히 인터넷으로 쓸모 없는, 그들을 비판 하는 것도 주저 없이 동의 하에 일부 사람들의 의견으로도이 관점에서 비판적으로 보고 해야 합니다. 마르크스주의 철학, 수정, 사용의 보기에서 Quweicunzhen, 그것의 본질을가지고, 그 부스러기, 정말 상속 하 고 앞으로 수행 되므로 그 본질을 이해할 수 있다.