대용량 데이터에 대 한 일반적인 오해

출처: 인터넷
작성자: 사용자
키워드: 우리 우리 우리가 아주 이 우리 아주 빅 데이터 우리가 아주 빅 데이터 오해

종종 기업가 그들의 회사 생성/기록 데이터의 많은 매일, 비록 그들은 시간이 되 고, 데이터를 사용 하는 방법을 알아 냈 하지 않은 하지만 그들은 모두 그것을 저장 하 라고 들었어요. 그들은 종종 말을 이러한 데이터를 통해 그들의 제품/서비스 크게 향상 됩니다, 데이터는 회사의 구세주. 내가 옳은 일 들에 대해 이야기 하 고 싶지 않아 하지만 큰 데이터에 대 한 두 가지 일반적인 오해를 설명 하 고:

데이터는 정보 같지

사람들이 종종 동의어로 데이터 정보 사용합니다. 사실, 데이터 (숫자, 텍스트, 그림 또는 비디오, 등을 통해 여부) 원시 데이터 요소를 나타냅니다, 정보 내용에 직접 연결 되어, 필요 정보 (정보). 더 많은 데이터를 반드시 더 많은 정보를 나타낼 수 있습니다, 더 많은 정보를 나타낼 수 있습니다 비율에서 증가 될 것 이다. 두 가지 간단한 예제를 살펴 봅시다:

Backup。 많은 사람들은 지금 그들의 하드 드라이브를 정기적으로 백업 해야 합니다. 이것은 설명 하는 많은, 각 백업 데이터의 새로운 세트를 만들 것입니다 하지만 정보 증가 하지 않습니다.

여러 소셜 네트워킹 사이트에 대 한 정보입니다. 우리 중 많은 활성에 다양 한 소셜 네트워킹 사이트, 그리고 더 우리는 소셜 네트워킹 사이트, 더 많은 데이터, 더 많은 정보에만 비례 하지. 뿐만 아니라 우리는 전달 친구 짹짹 (또는 다른 소셜 네트워킹 사이트에 콘텐츠), 서로 게 뿐만 아니라 그들의 많은 매우 유사 하기 때문에 그리고 그들 중 일부는 텍스트는 다른, 서로 매우 비슷합니다.

둘째, 정보는 같지 않습니다 지혜 (통찰력)

음, 우리는 데이터의 모든 중복 된 부분을 통해 결정 하 고 우리가 모든 정보를 같은 데이터를 통합 했습니다, 그것 될 것입니다 우리에 게 유용? 반드시, 정보 지혜, 적어도 세 가지 조건에 맞게 개조 되어야 한다:

해독 될 수 있습니다. 이 큰 데이터 나이 관련 문제가 있을 수 있습니다 그리고 점점 더 많은 기업이 매일, 많은 데이터를 생산 하 고 있습니다 하지만 그들은 그래서 그들은 일시적으로 구조화 되지 않은 그것을 저장, 그것을 사용 하는 방법을 생각 하지 않았습니다 (구조화). 구조화 되지 않은 데이터는 반드시 해독 하지. 예를 들어 세 번 간격 귀하의 사이트에 고객을 기록 했습니다: 3 초, 2 초, 17 초, 하지만 결국에서이 3 시간 무엇 무엇을 나타내는지 표시를 깜 빡, 이러한 데이터는 정보 (하지 반복), 하지만 하지 해독, 그래서 현명한 될 수는 없습니다.

관련성입니다. 우리는 관련성의 중요성을 설명 했다. 더 자세한 내용은 여기, 잡음 보다 아무것도 더 있다.

참신입니다. 이것은의 예 네트워킹 사이트 내가 Wenju, 하지만이 참신 하지 종종 데이터와 우리가 가진 정보에 의해 판단. 예를 들어 http://www.aliyun.com/zixun/aggregation/8002.html "> 데이터/정보의 집합을 통해 전자-상거래 회사 분석 고객 배달 제품의 하루 10 원 이상 지불할 용의가 있다 동일한 콘텐츠 다음 완전히 독립적인 데이터/정보, 없는 경우 후자는 소설의 또 다른 세트를 통해 얻을 수 있습니다. 불행히도, 대부분의 시간, 우리가 판단할 수 있다만 많은 양의 데이터와 정보의 참신.

말을 많이, 사실 표현, 하는, 그래서 우리가 하지 않아도 우리가 훨씬 더 큰 데이터 자체는 쇼가 생각 하는 유용한 데이터. 오늘날의 시대에는 평균 시작 1 GB 이상의 데이터, 하루 생산할 수 있는 그리고 약간 큰 회사 생산 데이터의 더 많은 결핵 매일. 그러나 큰 데이터 분석에 돈을 지출 하기 전에 우리가 데이터 정보 또는 지혜 대표 하지 않는 알고 있어야 합니다.

(책임 편집기: Schpeppen)

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.