호랑이 기사 "빅 데이터 업계 두 큰 실수"를 맡아 봤다고 하기 전에, 많은 친구 들 평가이 인센티브에 의해 잘, 더 쓰고 싶어 최근 목격, 경험 있는 프로젝트와 결합. 저자 정리, 후 큰 데이터는 정말 국가에 특히 많은 기본 개념 편차에 따른 거짓 주장에 많은 사람들이 오해를 많이 발견. 후에 기사, 그리고 많은 벽돌을 쏠 모두 데이터 오류에 대 한 이야기.
오해 3: 데이터의 양이 특히 큰 큰 데이터
를 호출 하는
"데이터 도메인"에 그런 사람들의 물결, 생각 하는 그들은 "그냥 라는 큰 데이터 위에 제타에도 큰 데이터 위에 PETA 수준만 아니다 아직 진짜 큰 데이터 나이!" "모든 시간을 듣고,이 사람들은 너무 많이 영향을 알고는" 용량 "의 IoE의 4V 이론. 이 점에서 나 라고 첫 번째 문장 "할 안 책 만큼는 IoE까지 편지", IoE 뿐만 아니라 하드웨어, 또한 비록 그것은 고전적인 이론이 많은 전통적인 거 인, 거 인, 도전 감히 마음에서 하지만 전자의 출현, 새로운 아이디어와 기술을의 발 아를 시작 하 게 하 고 싶습니다. 전통적인 거 인 것 이다 될 천천히 전복, 또한 우리의 인간 앞에 중요 한 요인입니다. 만약 우리가 여전히 미신 거 인, 아니 현재 Hadoop 있을 것입니다 개념을 추구 하 그래서 딱딱한 교리의 시대에 있어 현재 불꽃 있을 것입니다, 거기 되지 것입니다 지금 테슬라, 아무 기계 것 인공 지능, 학습 및 다음 n 번째 산업 혁명을 없을 것 이다.
큰 데이터를 강조 하 고 싶습니다 우선, 기술은 아니다 정말로 새로운 단어, 이전 기사에서 나는 즉 큰의 자연 데이터 또는 데이터, 업계 몇 년 동안 개발 되었습니다 그리고 데이터의 볼륨은 항상 이상 10 년 전, 같은 시대의 상상력을 넘어 플로피 디스크에 데이터의 크기는 또한 1.44M, 그리고 데이터에는 1T에 도달 하면, 그것은 다른 라즈베리을 만들 것입니다. 그래서 데이터의 양에 의해 누군가가 1T 데이터를 수집 하는 경우 것 이다 그것은 입력 큰 데이터 나이? 분명 하지! 그래서 내가 하 고 싶은 말 그 데이터의 크기는 하지의 큰 데이터를 "호랑이, 오래 된, 같은 젊은이 작은 되어야 합니다, 거 대 한 머리 큰 되어야 합니다, 공중 그네 해야 긴 날개." 마찬가지로 대형 데이터를 다음 단어 "빅 데이터" 인지 정말 한 의사 판단 하는 데이터의 양을 제안 하는 경우 이것은 정의의 순전히 문자 적 의미 이다.
그래서 다시, 큰 데이터의 개념은 무엇입니까? 첫째, 큰 데이터는 완전 한 생태계, 데이터 생성, 수집, 처리, 요약, 디스플레이, 광업, 푸시 등 폐쇄 루프 가치 사슬을 형성 하 고 다양 한 유용한 응용 프로그램 및 서비스를 제공 하기 위해 사업 현장에 대 한 각 연결을 처리 하는 기술을 통해. 둘째, 큰 데이터의 핵심은 무엇입니까? 한 손에 오픈 소스, 한 손으로 조절, 현재 큰 데이터 기술 핵심 목표는 더 나은 저가 기술 (특히 최근 몇 년 동안에서 더 구조화 되지 않은 데이터 처리)를 통해 데이터의 요구를 충족 하 고 투자 하기 가능한 만큼 엔터프라이즈의 요구를 충족 시키기 위하여. 1000 10000, 대용량 데이터의 핵심 개념 또는 응용 프로그램 요구를 충족, 기술 생산성, 기술 "활력의 낭비" 라는 아무 비즈니스 목표 라는 분명 한 목표는
오해 4: 대형 데이터
에 대 한 큰 데이터
내가 생각 하는이 오해는 가장 심각한. 일부 기업에서 최신, 최고의 가장 눈부신 기술 추구 되어야 합니다, 그리고 우리가 해야 합니다 국제 고급, 할 세계적인. 모든 기업, 지역, 자연과 산업으로 분할 되지 않는다 모두 외쳤다 "박쥐, 큰 데이터 도움을 잡아 * * * * 목표를 달성 하는 기업", IoE, 이동한 다음 클러스터에 투자 하는 것입니다 다음, 다양 한 고성능 소형 메인프레임 전에 넣어 사용 하지 않는 모든 O 기 권한 부여의 구입 하기 전에, 투자 설정 되어 따로 하룻밤 수십 년 동안, 그리고 더 많은 자원을 "빅 데이터"를 쫓는 지출 되었습니다.
학생, 비용이 많이 드는 것 들 모두 매일 듣고 것 이다 나 자신에 대 한 참조, 보 리더십 미소 것 비용에 많은 기업, 이것이 얼마나 큰 오해 아 생각의이 종류. 내가 말하고 싶은 것:
첫째, 기술적으로, 박쥐 등 대용량 데이터를 추구 하는 인터넷 회사의 많은 사업 개발 때문에 필요 합니다. 모든 인터넷 회사 트래픽에 대 한 라이브 출생 및 클릭, 즉 그 많은 양의 구조화 되지 않은 데이터 처리 해야 신속 하 게, 동시 방법의 숫자에서 기본 데이터를 분해 하는 인터넷 기업에 대 한 가능 하 게 하 그리고 신속 하 게 처리 하 고 그들의 서비스 사용자와 시장의 요구를 충족. 비즈니스 프로세스와 인터넷 기업의 비즈니스 모델 대용량 데이터 기술 채택 될 해야 합니다 결정 합니다. 반대로, 많은 기업은 이러한 기술이 필요 하지 않습니다, 그리고 개발 및 데이터 사이클 또는 매월 처리에 맞게 수식 중 일부에서 몇 가지 간단한 하나 또는 두 개의 Excel 파일을 사용할 수 있습니다, 그리고 이러한 기술을 사용 하 여 필요가 없습니다.
둘째, 투자의 관점에서 인터넷 기업에는 민간인, 태 어 났 그들의 개발에 더 잘 맞게는 부자도 전통적인 소형 컴퓨터 메인 프레임 이후에 큰 장비를 살 여유가 없다, 그것은 단지 이전 낮은 투자, 경량 구조, 가치 사슬 및 표준, 만들 수 있는 방법을 찾을 수 있습니다. 사업 개발을 충족 하기 위해 선형 하드웨어 투자의 지속적인 작은 양입니다. 대신, 일부 전통적인 회사의 그것의 투자 계획은 1 년 전에, 분명 빅 맥도 되며 투자의 원래 기초에 더 많은 투자 수익 (ROI), 지금 하기 위해 큰 데이터를 투자 하기 전에, 많은 양의 희생의 슬로건을 추구 하지만 "이익 보다 큽니다", 뿐만 아니라 나머지는 몬트리올의만 도덕적 무결성입니다.
큰 데이터 기술도 어떤 종류의 기술이 명확한 사업 목표는 출생의 특정 비즈니스 목표를 충족 하기 위해 동종 요법 디자인 기술 프레임 워크의 자체 사업 구조에, 과학 및 건강 한 개발 개념 이다. 보스, CEO 또는 투자자 인 경우 가끔 물 처럼, 기업에 대 한 그 큰 데이터 기술을 이해 해야 합니다. 그리고 비즈니스 목표는 배, "물가지고 있습니다 보트, 뿐만 아니라 전복."
생산 관계의 지속적인 조정을, 생산성 진행, 대용량 데이터의 현재 출현 등 급속 한 진행 됩니다 후 기술 라운드의 수 있을 것입니다 "기계 학습, 심도 있는 학습"와 다른 많은 인공 지능 기술, 또한 "작은 데이터", "마이크로-데이터" 등 출연 그리고 기술, 기술, 급류의 출현에 더 좋은 방향으로 그들의 자신의 사업에 따라 비즈니스 지향 마음에 맞게 분명 그들의 자신의 기술 프레임 워크를 디자인 해야 됩니다 학교, 잠수 하는 다양 한 개념의 다양 한.