전문가 의견: "빅 데이터"와 "대량 데이터"의 차이

출처: 인터넷
작성자: 사용자
키워드: 큰 데이터 거 대 한 데이터를

몇 년 전, 업계는 주제를 논의 했다: 대규모 데이터 처리 하는 방법? 특히, 일부 사용자 데이터 산업, 금융, 통신, 보험 및 기타 인기 있는 산업의 큰 숫자를 저장 해야 합니다. 사용자가 많은 양의 데이터는 하루의 거의 모든 시간을 생성 가능성이 그리고 저장 장치이 산업에서 꼼꼼하게 문서화 해야 합니다. 데이터 볼륨의 급속 한 증가 함께 많은 업계 사용자는 대규모 데이터 마이닝 귀중 한 정보에서 보물, "번호"를 변경 하는 방법을 찾기 위해 시작 했다.

구조화 된 데이터를 다음 솔루션의 큰 금액은 상대적으로 간단 하다, 경우에 사용자가 더 많은 스토리지 장비를 구입을 저장 장치 및 이러한 문제를 다른 솔루션의 효율성 향상. 그러나, 사람을 찾을 때 데이터베이스에 데이터가 세 가지 유형으로 분할 될 수 있다: 구조 데이터, 구조화 되지 않은 데이터와 반 구조화 된 데이터와 다른 복잡 한 상황, 문제 덜 간단 하 것으로 보인다.

큰 데이터 조회 수입니다.

복잡 한 데이터의 종류는 서 지, IT 시스템 사용자에 미치는 영향을 다루는 또 다른 방법은 있을 것입니다. 많은 업계 전문가 및 제 3 자 수 사관은 일부 시장 조사 데이터를 통해 빅 데이터 시대 오고 있다 하는 것을 발견 했다. 이러한 복잡 한 데이터에 데이터의 85%가 소셜 네트워크, IoT, 구조화 되지 않은 데이터에 속하는 조사 발견 전자-상거래, 등등. 이러한 구조화 되지 않은 데이터의 생성은 종종 등장과 새로운 채널 및 기술 소셜 네트워크, 모바일 컴퓨팅, 센서 등의 응용 프로그램 함께 합니다.

이제 대용량 데이터의 개념은과 대 광고의 많은 불확실성을 많이 합니다. 이 위해 관련 문제를 이해 하는 일부 업계 전문가를 자세하게 편집기 큰 데이터는 그리고 무엇 아니라, 그리고 큰 데이터와 다른 문제, 네티즌과만 나 기사의 일련의 양식 처리 하는 방법에 대해 이야기 하도록 요청.

많은 결핵 데이터 집합은 "큰 데이터." 라고도 시장 조사 기관인 IDC에 따르면 데이터 사용은 44 번 배 성장할 것으로 예상 하 고 글로벌 데이터 사용 약 35.2ZB에 도달 한다 (1ZB = 1 십억 TB). 그러나, 단일 데이터 집합의 파일 크기 또한 증가 합니다, 분석 하 고 이러한 데이터 세트를 이해 큰 처리 능력에 대 한 필요의 결과로.

EMC는 1000 이상 고객 1PB 사용 했다 2020 년까지 100, 000에 성장할 것 이다 그들의 배열에서 (기가 비트) 데이터. 일부 고객도 1 년 또는 2, 1EB에 시간 더 많은 데이터 번 수천 보다는 더 많은 사용 하 여 시작 됩니다 (1 바이트 = 1 십억 GB) 이상.

대기업, 큰 데이터에 상승 일부 있기 때문에 컴퓨팅 파워는 저렴 한 비용, 사용 가능 및 시스템은 이제 멀티태스킹의 능력 이다. 둘째, 메모리의 비용 또한 급락, 기업이 어느 때 보 다도 메모리에 더 많은 데이터를 처리할 수 있습니다 그리고 그것은 집계 컴퓨터 서버 클러스터로 간단 하 게. IDC는 이러한 세 가지 요소의 조합 큰 데이터를 양산 했다 생각 합니다. 동시에 IDC는 기술 빅 데이터 기술에 대 한 먼저 해야 했다 비용 저렴, 뒤에 IBM에 의해 설명 된 세 가지 "V" 조건: 다양성 (다양 한), 볼륨 (볼륨)과 속도 (velocity).

다양성은 데이터 구조화 및 구조화 되지 않은 데이터를 포함 해야 의미 합니다.

볼륨 분석 매우 큰 것을 위해 함께 집계 되는 데이터의 양을 말합니다.

그러나 속도,, 데이터 처리 빨리 해야 의미 합니다.

큰 데이터 "하지 항상 있다 수백 TB. 실제 사용, 때로는 수백 기가바이트의 데이터 호출할 수 있습니다 그것의 제 3 차원에 주로 달려 있는 큰 데이터에 따라 즉, 속도 또는 시간 차원.

가 터가 말한다 글로벌 정보 이상의 59% %의 연간 속도로 성장 하 고, 볼륨은 데이터, 비즈니스, 그리고 그것은 지도자 관리에 중요 한 도전 하는 동안 정보, 종류 및 속도에 초점을 해야 합니다.

볼륨: 엔터프라이즈 시스템 내의 데이터 증가 트랜잭션 볼륨, 다른 일반적인 데이터 형식 및 새로운 데이터 형식에 의해 발생 합니다. 너무 많이 저장 문제 이지만 너무 많은 데이터 분석의 문제입니다.

카테고리: 그것은 지금 더 많은 종류의 정보 분석-주로 소셜 미디어와 모바일 (상황 인식)에서 있이 필요가 지도자의 거래 정보로 결정-거기는 많은 변화에 의해 시달려 되었습니다. 카테고리 포함 테이블 형식 데이터 (데이터베이스), 레이어 데이터, 파일, 전자 메일, 측정 데이터, 비디오, 정적 이미지, 오디오, 주식 시세, 금융 거래, 및 더.

속도:이 데이터, 구조화 된 레코드를 생성 및 액세스 및 배달의 가용성의 흐름을 포함 한다. 속도 얼마나 빨리 데이터를 생성 되는 고 수요를 충족 하기 위해 데이터를 처리 합니다 얼마나 빨리 의미 합니다.

큰 데이터는 큰 문제는, 진짜 문제는 만들고 더 의미 있는 큰 데이터 찾기 패턴 조직 더 나은 비즈니스 결정을 내릴 수 있도록 큰 데이터에 가트너 분석가 들은 말한다.

(책임 편집기: 유산의 좋은)

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.