큰 데이터 및 그들을 해결 하는 방법의 5 가지 오해

출처: 인터넷
작성자: 사용자
키워드: nbsp 대용량 데이터 오해 데이터 웨어하우스

& http://www.aliyun.com/zixun/aggregation/37954.html "> nbsp; 어떤 사람들 기간 "빅 데이터" 아무것도 기업의 마케팅과 대 광고 라고 생각 합니다. 하지만 큰 데이터 개념에 동의 하는 사람들 조차 큰 데이터 신화 중 일부를 제거 해야 합니다.

가트너, 세계 최고의 정보 기술 연구 및 컨설팅 회사는 지적 하는 큰 데이터 개념에 대 한과 대 광고 하면 옳은 액션 플랜을 선택 하는 기업에 대 한 더 큰 문제 있지만 나머지 신화 중 일부를 제거 하는 데 도움이 되지 않습니다.

예를 들어 데이터의 80%는 구조적는 잘못 된, 그리고 고급 분석 일반 분석의 더 복잡 한 모양으로, 가트너는이 지적 하는 분석 회사 또한 올바르지 않습니다.

가트너, "대용량 데이터 분석 기능에의 영향에 대 한 주요 오해"와 큰 데이터 정보 인프라에의 영향에 대 한 "주요 오해" 출판 보고서 두, 분석 기능 및 오해에 관련 된 정보 인프라의 영향에 큰 데이터에 초점을, 더 많은 실제 상황에 관련 된 큰 데이터를 표시 하려면. 큰 데이터의 개념에 대 한 다음 5 오해.

신화 1: 대용량 데이터 기술 배포, 다른 사람들이 우리입니다.
대용량 데이터 기술 및 서비스에 초점을 점점 더 많은 회사를 시작 하는 동안 가트너 계산 73%의 기업에 투자 하거나 큰 데이터 기술, 계획 하지만 대부분 기술을 수용 하기 시작 합니다.

그것은 그러므로 시끄럽게 그 경쟁자를 걱정 하는 큰 데이터 기술을 사용 하 여 빠르게 개발입니다. 사실, 응답자의 단지 13%는 실제로 큰 데이터 관련 기술 배포 시작.

"회사에 대 한 가장 큰 도전 이며 큰 데이터에서 값을 가져오는 방법을 큰 데이터 기술을 배포 하는 방법," 가트너는 말했다. 대부분의 조직에서는 비즈니스 프로세스 또는 실제 사용 하는 경우에 그들은 기술을 사용 하지 않는 때문에 파일럿 단계에서 어려움을 경험. "

가트너는 않은 뒤 마칩니다. 실제 작업에 대 한 전략을 개발 하 고 작업할 및 사업부.

신화 번호 2: 데이터의 볼륨이 큰, 및 작은 결함이 중요 하지 않습니다
그것은 되었습니다 주장, 법률의 큰 숫자, 독립적인 데이터 결함 중요 하지 않습니다 분석 결과는 영향을 미치지 않습니다.

독립적인 데이터 결함 보다 더 작은 데이터 집합, 전체 데이터 집합에 훨씬 작은 영향 없어 하지만 순간 데이터의 볼륨 성장, 그리고 데이터 결함은 그 어느 때 보다 성장 하 고 있다.

"결과, 낮은 품질 데이터에 전체 데이터 집합의 전반적인 영향 그대로," 가트너 말했다. 또한, 대용량 데이터 환경에서 기업에 의해 사용 되는 데이터의 대부분의 데이터 구조와 소스 알려지지 않은 외부 데이터 원본에서 제공 됩니다. "

"즉, 데이터 품질 문제의 위험이 그 어느 때 보다 높다. 결과적으로, 데이터 품질은 실제로 더 큰 데이터 배포에서 중요 합니다. "

가트너는 새로운 데이터 품질 관리 방법을 설계 하 고 데이터 품질 수준을 선택 하 여 마칩니다. 데이터 품질 보증의 핵심 원칙에 엄격한 준수

신화 3: 큰 데이터 데이터 통합 기능을 대체 합니다.
기업 읽기-시간 스키마 (스키마 읽기에)를 통해 정보를 처리 하 고 여러 데이터 모델을 사용 하 여 동일한 데이터 소스를 유연 하 게 읽고 싶어. 이 유연성에 임의의 데이터를 해석 하 고 개별 사용자 데이터 액세스의 사용자 지정을 달성 하는 방법을 결정 하는 최종 사용자가 도움이 됩니다. 그러나, 대부분의 사용자는 실제로 쓰기-시간 패턴 (쓰기에 스키마)를 사용합니다. 쓰기-시간 모드에서 사용자가 데이터를 설명 하 고 콘텐츠, 수 그리고 데이터 무결성 일치 수 있습니다.

신화 4: 무의미 한 고급 분석을 위한 데이터 웨어하우스를 사용 하는.
어떤 사람들 데이터 웨어하우스 배포 때 고급 분석 기능 새 데이터 형식을 사용할 수 있는 시간 낭비 라고 생각 합니다. 사실, 가장 진보 된 분석 프로젝트 분석을 위한 데이터 웨어하우스를 사용합니다.

새로운 데이터 형식을 데이터 분석에 맞게 세련 되도 해야 합니다. 또한, 결정은 관련 데이터에 필요한 데이터 및 데이터 품질의 필요한 수준을 집계 하는 방법.

가트너의 결론 데이터 웨어하우스를 사용 하 여 고급 분석 기능 가능 하면 수동으로 수집된 데이터 집합을 저장 하는 것입니다.

신화 번호 5: 데이터 호수 대체 데이터 웨어하우스
데이터 호수 솔루션은 다양 한 데이터 소스 기본 형식으로 분석 하기 위한 엔터프라이즈 플랫폼으로 서 일반적으로 판매 된다. 하지만 가트너 데이터 호수 데이터 웨어하우스를 대체 하는 잘못 된 아이디어는 믿고 또는 분석 인프라의 중요 한 요소.

이미 구성 된 데이터 웨어하우스 기술에 비해, 데이터 호수 기술 성숙 이며 그 기능을 포괄 하지 않습니다. "데이터 웨어하우스는 여러 사용자 그룹을 지 원하는 기능이 있습니다." "따라서, 기업 할 필요가 없습니다 데이터 호수 기술 성숙에 대 한 대기."

가트너는 데이터 호수 기술 Hadoop 등 기존 데이터 웨어하우스에 사용 됩니다 마칩니다. 메타 데이터 관리 기술에 투자 하 여,만 도구 및 훈련 수 우리 만들 데이터 호수 기술을 통해 비즈니스 가치.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.