텍스트/클라우드 컴퓨팅 큰 데이터 들 (마이크로 크레딧 공공 계정 Ccdcnewtrend)와
아무 논리, 시스템, 조각, 목적은 질문, 큰 데이터 패션 단어,이 생각 되고있다. 생각 하 고. 현상에서 시작 하는 마음에, "마스터"는 비밀리 단어 "마스터"만 귀신, 영혼, 사람들에 게 적합 하지 않은 위해 적합 하다는 생각. 이 생각 인지 격려, 비판, 또는 심지어 공격으로 심장, 생각을 홍보할 수 있는 아이디어, 보기의 모든 종류의 충돌을 기대 하고있다.
결합 하 여 모든 사람의 비판과 제안, 보충, 후 일부 생각의 문제에 어떤 초점도로 전사 통신을 환영 했다.
큰 데이터 고려 사항 중 하나
어떤 웹사이트의 데이터는 아무리 어떻게 포괄적인 하위 집합, 얼마나 깊은 분석은, 하위 집합, 완전 한 컬렉션이 아닌 사람들의 인터넷 행동 데이터의 아주 작은 부분 집합 이다. 기업에 대 한 경쟁 업체의 데이터 값까지 그들의 자신의 사이트 데이터 보다 더 많은 가치, 규모에서 모든 회사에 대 한 동일 하, 그들의 자신의 데이터는 완전 한 데이터 보다 훨씬. 전체 데이터는 불완전 한 데이터 정확 하 게 같다.
추가: 어떤 친구는 "경쟁 업체의 데이터의 가치는 그들의 사이트 데이터의 값 보다 훨씬 더 큰" 판단을 잘못. 적에 매우 중요 한, 실제적인 중요성은 겸허 하 게 동의 "기업의 생존은 키를 자신의 하지만 경쟁 그들의 자신의 일을 하는 방법,이 맥락에서 수행 합니다 경쟁 업체의 데이터 값까지 자체 웹 사이트 데이터의 값을 초과 하면 "
큰 데이터 생각 두번째
데이터 볼륨에 있는 큰 증가 정확 하지 않은 결과가 발생할 수 있습니다 하 고 혼합된 정보 서로 다른 소스에서 데이터의 혼란을 증가할 것 이다. 연구 발견 거 대 한 데이터 집합 및 미세 입자의 측정 "오류 검색"의 모험에 있는 증가에 지도. 인수 가설, 테스트, 및 과학적인 방법의 유효성 검사는 "오래 된" 빅 데이터 시대, 당황 하 고 혼란 이며 사람들이 단순히 케빈 켈리 혼돈 부르는 포용.
추가: 보기 Schoenberg 빅 데이터 시대에 널리 허용: 정밀만 혼합, 아무 인과 관련"하지 않고" 빅 데이터는 잘못. 뉴턴, 아인슈타인, 또는 웨버의 이상적인 형식이 분석 방법에 대 한 하이브리드 검색 인지 분석 값, 적당 한 밖으로 정렬할 필요가 있는 하이브리드 여러 번 찾을 수 없는 원인 이해, 인과 전에 고 가공 연구의 핵심입니다.
빅 데이터에 대 한 세 가지 생각
인터넷 사용자, 소비자 행동, 인터넷 행동, 채널 환경 설정, 행동 환경 설정, 생활 추적 및 위치 등의 기본적인 특성 사용자의 기본 동작을 반영합니다. 시스템 무결성 모든 분석 작업의 첫 번째 단계 이며 완전 한 프레임 워크는 고급 모델 보다 더 나은. 인간 이해의 가장 큰 위험은 결과에 현지 지식의 사용 이다. 경우에 그들의 자신의 사이트 데이터에 대 한 우려, 그 분석 자료 데이터 손상에 바인딩됩니다.
추가: 골절 데이터의 치열 한 경쟁에서 더 분명 될 것입니다, 많은 인터넷 기업 걸릴 CRM 관리 시스템 데이터 마이닝 및 데이터 분석 시스템, 아이디어는 잘못, CRM 목표는 규범적인 보고서, 데이터 분석 및 데이터 마이닝 목표는 탐구 유도
4를 생각 하는 큰 데이터
지금 그것은 큰 데이터에 관해서 라면, 기본적으로 4 개의 혼란 스러운 개념: 첫 번째, 대형 데이터 무시 하 고 전체 데이터 또는 심지어 가든지 샘플링, 두 번째, 지속적인 데이터는 대용량 데이터 이며 셋째, 데이터 볼륨이 크고; 해당: 샘플링 데이터 만큼 합리적인 샘플링으로 결론은 정확한 연속 데이터 구조만, 많은 잡음; 잘못 된 결론에 올 것 이다
추가: 큰도 서 피곤된에 기본 데이터 필드는 인터넷의 현실, 개념은 매우 혼란, 사실, 인간의 경험에 의해 축적 된 데이터는 소위 거 대 한 데이터를 포함 하 여 모든 분석의 기초도 서의 방법 태 어 났, 하지만 또한 떨어지지도 않았어요, 너무 강한 오해의 소지가 없는 실제 운영 경험 축적.
5 생각 하는 큰 데이터
큰 데이터 새, 날씨, 지진, 양자 물리학, 유전학, 의학 등은, 참고를 위해 유용한. 그들은 샘플 조사를 사용합니다. 같은 인간의 복잡성 때문에 더 어렵습니다 인터넷 데이터 마이닝 방법론의 사실 이다. 이후 인간의 연구에 대 한, 우리 큰 데이터를 빗을 모든 연구 들을 사용 해야 합니다. 프로그래밍의 이해 이해 데이터의 전송 수 데이터 마이닝 인수는 false입니다.
추가: 큰 데이터 하지 새로운, 그냥 새로운 빠른 방법 데이터를 수집, 모든 연구 방법 및 큰 데이터에 적용 하는 인간의 메서드는 데이터 마이닝의 핵심, 데이터 전송 기능은 기술적인 부분, 관계는 감독과 클립을 유사.
6 생각 하는 큰 데이터
첫 번째, 대용량 데이터 분석 프레임 워크의 분석 알고리즘은 매우 중요 한, 또한 최근 대형 데이터 처리에서 발견: URL의 분류는 어려운, 여러 측면이 있습니다, 비록 일부 알고리즘에는 사람들의 네트워크 동작 데이터의 수천의 수만 1 일 약 50, 000의 도메인 이름 생성 하지만 식별 하기 어려운 혼란, 지속적인 업데이트와 차별 간단 하 고 쉽게, 파인 포인트 어려운 분석에서 중요 한 단계입니다.
보완: 알고리즘, 데이터 아키텍처에 의존 하 고 알고리즘 정말 인간의 행동을 이해 하는 데 필요한.
7 생각 하는 큰 데이터
알고리즘, 긴 텍스트의 포함으로 있을 두 가지 핵심 기본 기술: 키워드 (사전) 및 의미 분석, 키워드 기술 성숙, 의미 론 적 기술은 병목, 중국 의미는 너무 해결 하기 어려운 팀의 50%는 좋은, 특히 사회 언어, "정말 수!" 등 "솔루션은 무엇입니까"? 필요한 컨텍스트입니다. VCs 같은 기본적인 기술 연구를 장려 것 이다 개발, 휴식이이 병목을 통해 큰 데이터 마이닝의 주요 포인트 중 하나입니다 바랍니다.
8을 생각 하는 큰 데이터
소셜 데이터 마이닝, 트위터 폭포 아이디어, 즉, 시각화 기술의 사용에 많은 팀 초점 그것의 아름 다운 구성 훌륭합니다, 그리고 문제는, 그것의 이론 아직도 30 년 이상 전에, 사회 측정의 개념은 포인트, 교량, 의견 지도자 및 다른 작은 그룹 분석, 거 대 한 그물에 적합 하지 않은 사회 분석 시각적 프레임 워크를 통해 휴식 이론적 탐사 및 실용적인 노력 필요 합니다.
추가: 이해 사회 의미 구조 프레 젠 테이 션 보다 더 중요 하다
9 생각 하는 큰 데이터
사회 생활에서 모바일 인터넷의 충격은 시간과 공간의 해체, 같은 대용량 데이터의 분석 파악 해야이 두 지점을 경우에 동작, 움직임의 의미의 손실에 대 한 다음 분석을 사용 하는 응용 프로그램 및 네트워크의 분석. 유량과 클릭률 등 간단한 그림 없는 복잡 한 마케팅 문제를 해결할 수 있다. 혁신 없이 생각의 원래 모드의 지속은 인간의 생각의 관성 이다.
추가: 인터넷 및 모바일 인터넷 관련 있다 두 가지.