-한번에
& http://www.aliyun.com/zixun/aggregation/37954.html "> nbsp; 몇 가지 큰 쇼핑몰에서 쇼핑을 고 가끔 기저귀 옆에 맥주는 찾을 거 야. 접근-월마트, 많은 슈퍼마켓 쇼핑객에서 데이터를 분석 하 고 그들이 맥주를 살 때 남자 종종 기저귀를 구입 발견에서 첫 번째 온다. 그래서 슈퍼마켓 기저귀와 맥주 판매, 수익을 올리기 위해 함께 넣어.
기저귀와 맥주 훌륭한 연결 파고 및 많은 데이터의 분석 이다. 이 작은 경우는 큰 데이터 생각을 반영 한다. 큰 데이터의 나이에 큰 데이터 생각의 빅터 Maire Schoenberg는 3 원칙: 첫 번째, 하지 원인, 하지만 관련성; 두 번째, "샘플 = 모든"-모든 데이터; 하지만 즉시 샘플 세 번째, 정밀 하지, 하지만 혼합. 즉, "빅 데이터" 이해할 수 있습니다 쉽게 "" 밖으로 파고 데이터의 많은 우리는 인식, 비밀 링크에 가능한 경우에 우리가 왜 모 르 겠 여.
큰 데이터는 흥미 진 진한 미래를 묘사 하 고 그것은 "빅 데이터" 되었음을 뜨거운 개념 중 하나는 오랜 시간에 대 한. 한편 팬 들과 좋은 상상력의 큰 데이터에 사람들, 세계에 살고 있는 우리는 "데이터": 일의 "인터넷", 구매 행동, 내비게이션, 위치 데이터, 마이크로 크레딧, 통신 데이터의 데이터... 이 큰 데이터 나이 대 한 가능성을 제공 한다 다른 한편으로, 현대 사회에 여전히 많은 미해결된 문제, 많은 장애물, 직면 하 고 사람들이 큰 데이터 "에 조 수" 하 고 말썽 현대인을 도와 수 바라고 있다.
이러한 맥락에서 큰 데이터는 되 고 지속적으로 "deified". 데이비드 브룩스 뉴욕 타임스 칼럼니스트, 큰 데이터를 할 수 있습니까? "그것은 다른 소리를 만들기 어렵다입니다. 그는 큰 데이터에 여러 가지 결함이 지적 했다. 첫째, 큰 데이터는 중요 한 정보를 많이 무시 하는 그래서 품질, 보다는 오히려 관계의 수를 분석에 좋다. 예를 들어 소셜 네트워킹 데이터 만나서 그들 76% 번 하루, 하지만 그것의 당신에 게 1 년에 두 번을 보면 어린 시절 파트너를 찾기 어려운 동료의 6 알 수 있습니다. 두 번째, 큰 데이터는 백그라운드를 이해 하지 않습니다. 우리 말 단어는 심각한 또는 농담, 분노 또는 친선을 표현 하는,이 특정 분석의 맥락에서 배치 한다, 여부를 데이터 분석은 이러한 이해 하기 어려운. 예를 들어, 큰 데이터 의미 유물을 많이 가져올 수 있다; 데이터 호의 트렌드, 혁신을 무시 하 고 원래 데이터는 원래, 원래 데이터 자주 왜곡 하 고.
또한, 어떤 사람들 생각 대용량 데이터에 대 한 가장 큰 문제는 그것은 더 나은 데이터, 더 많은 데이터의 역할 과장입니다. 사실, 우리의 가장 큰 문제는 데이터를 얻을 하는 방법 것 하지만 확률의 응용 프로그램의 규모, 데이터 사이의 링크를 찾을 수 모델 확장 지난 10 년간, 그러나 정확도 어떻게 침체는 교훈을 잊지 해서는 안됩니다. 맥주와 기저귀는 단지 가장 피상적인 데이터 마이닝, 그리고 진정한 데이터 처리 수만 번 Google 번역 보다 더 복잡 하지만 경우에 Google 번역은 "고급", 그것 "품질"을 기대 하지 않는다. "는 태평양 물, 플러스 대서양은 같은 물," 어느 정도 데이터의 규모를 지속적으로 확장의 중요성 더 이상 아무 협회, 더 이상 데이터 사용, "무차별"는 실제로 "의사 관련."
모두 큰 데이터, 처럼 모두가 혁신 및 개혁에 대 한 호출에 대 한 호출 합니다. 그러나, 문제의 어려움에 항상 있다: 혁신, 개혁 하는 방법 하는 방법. 우리 생각의 불꽃을 빛을 우리를 위해 큰 데이터 생각 필요 하지만 동시에 우리 데이터 협회를 찾는 큰 어려움을 직시 한다. 그렇지 않으면, 큰 데이터 쉽게는 빈 될 수 있습니다 제자리 헛 되 게 많은 사람들이 12 닭 피 같은 막 무가 내 열정, 인간과 금융 자원의 많은 단어, 소용돌이 생각 "금산"을 파고, 실제로 쓸모 없는 데이터 들을 잔뜩입니다.