종종 기업가 그들의 회사 생성/기록 데이터의 많은 매일, 비록 그들은 시간이 되 고, 데이터를 사용 하는 방법을 알아 냈 하지 않은 하지만 그들은 모두 그것을 저장 하 라고 들었어요. 그들은 종종 말을 이러한 데이터를 통해 그들의 제품/서비스 크게 향상 됩니다, 데이터는 회사의 구세주. 내가 옳은 일 들에 대해 이야기 하 고 싶지 않아 하지만 큰 데이터에 대 한 두 가지 일반적인 오해를 설명 하 고:
데이터는 정보 같지
사람들이 종종 동의어로 데이터 정보 사용합니다. 사실, 데이터 (숫자, 텍스트, 그림 또는 비디오, 등을 통해 여부) 원시 데이터 요소를 나타냅니다, 정보 내용에 직접 연결 되어, 필요 정보 (정보). 더 많은 데이터를 반드시 더 많은 정보를 나타낼 수 있습니다, 더 많은 정보를 나타낼 수 있습니다 비율에서 증가 될 것 이다. 두 가지 간단한 예제를 살펴 봅시다:
Backup。 많은 사람들은 지금 그들의 하드 드라이브를 정기적으로 백업 해야 합니다. 이것은 설명 하는 많은, 각 백업 데이터의 새로운 세트를 만들 것입니다 하지만 정보 증가 하지 않습니다.
여러 소셜 네트워킹 사이트에 대 한 정보입니다. 우리 중 많은 활성에 다양 한 소셜 네트워킹 사이트, 그리고 더 우리는 소셜 네트워킹 사이트, 더 많은 데이터, 더 많은 정보에만 비례 하지. 뿐만 아니라 우리는 전달 친구 짹짹 (또는 다른 소셜 네트워킹 사이트에 콘텐츠), 서로 게 뿐만 아니라 그들의 많은 매우 유사 하기 때문에 그리고 그들 중 일부는 텍스트는 다른, 서로 매우 비슷합니다.
둘째, 정보는 같지 않습니다 지혜 (통찰력)
음, 우리는 데이터의 모든 중복 된 부분을 통해 결정 하 고 우리가 모든 정보를 같은 데이터를 통합 했습니다, 그것 될 것입니다 우리에 게 유용? 반드시, 정보 지혜, 적어도 세 가지 조건에 맞게 개조 되어야 한다:
해독 될 수 있습니다. 이 큰 데이터 나이 관련 문제가 있을 수 있습니다 그리고 점점 더 많은 기업이 매일, 많은 데이터를 생산 하 고 있습니다 하지만 그들은 그래서 그들은 일시적으로 구조화 되지 않은 그것을 저장, 그것을 사용 하는 방법을 생각 하지 않았습니다 (구조화). 구조화 되지 않은 데이터는 반드시 해독 하지. 예를 들어 세 번 간격 귀하의 사이트에 고객을 기록 했습니다: 3 초, 2 초, 17 초, 하지만 결국에서이 3 시간 무엇 무엇을 나타내는지 표시를 깜 빡, 이러한 데이터는 정보 (하지 반복), 하지만 하지 해독, 그래서 현명한 될 수는 없습니다.
관련성입니다. 우리는 관련성의 중요성을 설명 했다. 더 자세한 내용은 여기, 잡음 보다 아무것도 더 있다.
참신입니다. 이것은의 예 네트워킹 사이트 내가 Wenju, 하지만이 참신 하지 종종 데이터와 우리가 가진 정보에 의해 판단. 예를 들어 데이터/정보의 집합을 통해 전자-상거래 회사 10 위안 하루, 전달 하는 제품에 대 한 지불 고객의의 지를 분석 하 고 다른 집합이 완전히 독립적인 데이터/정보, 없는 경우 후자는 소설을 통해 동일한 콘텐츠를 가져옵니다. 불행히도, 대부분의 시간, 우리가 판단할 수 있다만 많은 양의 데이터와 정보의 참신.
말을 많이, 사실 표현, 하는, 그래서 우리가 하지 않아도 우리가 훨씬 더 큰 데이터 자체는 쇼가 생각 하는 유용한 데이터. 오늘날의 시대에는 평균 시작 1 GB 이상의 데이터, 하루 생산할 수 있는 그리고 약간 큰 회사 생산 데이터의 더 많은 결핵 매일. 그러나 큰 데이터 분석에 돈을 지출 하기 전에 우리가 데이터 정보 또는 지혜 대표 하지 않는 알고 있어야 합니다.