용어는 "빅 데이터" 라고 할 필요는 없습니다 "빅 데이터"는 어떤 활동이 나 회의 지난 2 년 동안에서 인터넷에 관련 된 필요 합니다. 최근 결론 "중국 인터넷 회의"의 13 세션은 또한 전용 대용량 데이터 포럼.
큰 데이터 개업 또는 첫 접촉, 일반적인 느낌이 있을 수 있습니다: 큰 데이터는 유용! 큰 데이터를 사용 하는 방법?
수많은 책과 대용량 데이터에 대 한 기사는 메시지 공유 것: 점점 더 많은 업계 사람들에 관심을 지불 하 고 실제로 큰 데이터 응용 프로그램을 탐험 하기 시작 했다, 우리는 함께 묘사는 청사진의 위대한 유틸리티의 큰 데이터를 하지만 연습 하는 방법에 우리는 여전히 초기 단계에에서는
큰 데이터 기본 인터넷, 데이터 웨어하우징, 데이터 마이닝, 클라우드 컴퓨팅 및 기타 인터넷 기술 개발에 대 한 토대를 마련 하는 큰 데이터 응용 프로그램입니다. 그러나, 실용적인 응용 프로그램은 탐험의 진행. 탐구 학습, 뿐만 아니라 내가 내 자신의 관점에서 4 개의 질문을 당신과 토론 하 고 싶습니다: 큰 데이터는 무엇입니까? 큰 데이터는 무엇을 할 수 있습니까? 큰 데이터 실제로 무엇입니까? 큰 데이터는 무엇입니까?
큰 데이터를 첫째, 무엇입니까?
참조 3 더 일반적으로 큰 데이터 정의 사용:
(1) 의사 결정 능력, 통찰력 발견 및 프로세스 최적화 기능 대규모, 높은 성장 속도와 다양 한 정보 자산 더 새로운 처리 모드에 대 한 필요 합니다.
-가트너
(2) 대규모 데이터 규모 (거래량), 빠른 데이터 흐름 및 동적 데이터 시스템 (속도), 다양 한 데이터 형식 (다양 한), 큰 데이터 값 (값)
-idc
(3) 또는 거 대 한 양의 데이터, 대규모 데이터, 큰 정보, 참조 데이터 관련된 수의 크기를 읽을 수 없습니다 통해 인공, 요격, 합리적인 기간 내 관리, 처리, 및 인간 수에 데이터 정렬 정보.
-위 키
큰 데이터의 다른 정의 아마 비슷한, 그리고 우리 큰 데이터를 정의 하는 몇 가지 핵심 단어를 사용할 수 있습니다.
첫 번째, "대규모"이이 크기는 두 개의 차원에서 측정 될 수 있다, 하나는 데이터 시간 시리즈를 많이 축적 하 고 두 번째입니다 자세한 데이터의 깊이.
둘째, "다양화" 텍스트, 사진, 비디오 등의 다른 데이터 형식 수, 인구 데이터, 경제 데이터를 같은 데이터를 다른 카테고리 수 있으며 인터넷, 센서 등의 다른 데이터 원본에 있을 수도 있습니다.
세 번째, "동적"입니다. 데이터는 끊임없이 변화 하 고, 그리고 시간이 지남에, 신속 하 게 많은 데이터를 추가할 수 있습니다 또는 그것 공간에서 변화 데이터를 수 있습니다.
이 세 가지 키워드는 대용량 데이터의 이미지를 정의합니다.
그러나 그것은 또한 "신속 하 게 처리" 하는 핵심 능력을 요구 한다. 같은 큰, 다양 하 고 동적 데이터를 하지만 그것 분석 처리 하는 데 시간이 오래 걸릴 것입니다, 그건 큰 데이터. 다른 관점에서 이러한 데이터 매뉴얼에 의해 신속 하 게 처리를 달성 하기 위해 긍정이 달성, 수 없습니다 따라서 기계 구현의 도움을 사용 하 여.
마지막으로, 우리는 이러한 데이터 분석의 신속한 처리를 통해 기계를 사용 하 여 전체 시스템의 응용 프로그램 또는 원하는 정보를 얻기 위해, 큰 데이터 라 할 수 있다.
우리 큰 데이터를 정의 하는 다음 다이어그램을 사용할 수 있습니다.
큰 데이터의 개념 정의 무엇을 할 수 있는 큰 데이터?
아마도 과정에서 큰 데이터를 적용 하려는.
먼저 우리 데이터 소스를가지고 수집 하 고 데이터를 저장할 필요가,이 기준, 그리고 분석 응용 프로그램, 폼에 우리의 제품 및 서비스, 그리고 제품 및 서비스 새로운 데이터를 생산할 예정 이다, 이러한 새로운 데이터는 우리의 프로세스에 재활용 됩니다.
이 전체 사이클 시스템은 기계를 통해 자동화 될 수 있는 지능형 시스템, 상업 또는 그렇지 않으면 새 패러다임 될 수 있습니다 그것.
다음 실제 응용 프로그램에 특정, 생각, 큰 데이터 응용 프로그램에 구현할 수 있습니다, 요약 될 수 있다 최대 2 개의 방향, 하나 정밀 사용자 지정, 두 번째 전망 이다.
첫째, 사용자 지정의 정밀도입니다.
주로 양쪽의 수요와 공급을 겨냥, 공급자 Dingzhun 포지셔닝 목표를 도움이 다음 제품 수요에 기반을 제공 하 고 궁극적으로 수요와 공급 사이의 가장 일치를 달성, 수요-측면 맞춤된 요구에 액세스할.
특정 응용 프로그램의 예도 세 가지 범주에 정리 수 있습니다.
하나는 맞춤 제품, 지능형 검색 엔진 등 동일한 콘텐츠를 검색, 모두의 결과 다릅니다. 또는 일부 사용자 지정 된 뉴스 서비스, 또는 온라인 게임.
두 번째는 정밀 마케팅, 지금 일반적인 인터넷 마케팅, 바이 두의 진흥, Taobao의 웹 프로 모션, 또는 때 한 장소에 도착, 자동으로 주변 소비자 시설 추진 정보 푸시의 위치에 따라.
세 번째는 공공 인프라의 siting 또는 소매점, 위치를 포함 하 여 위치 위치입니다.
이들은 사용자 요구의 대용량 데이터 분석을 통해 고 상대적으로 맞춤형된 서비스를 제공 하는 다음.
두 번째 방향, 예측의 응용 프로그램입니다.
예측에 근거를 둔 그것의 과거와 미래 관련된 요인 및 데이터 분석, 조기 경보, 대상 개체 또는 실시간 동적 최적화 주위 주로 이다.
특정 응용 프로그램에서 또한 나눌 수 있습니다 세 가지 범주로.
하나에 전자 정부 업무 뿐만 아니라 엔터프라이즈의 동작 결정, 보안 투자 의사 결정, 의료 계 임상 진단 및 치료 지원, 작은 결정 지원 클래스입니다.
두 번째는 위험 조기 경고 범주, 전염병 예측 등, 매일 건강 관리, 운영 및 유지 보수 장비와 시설, 공공 안전, 금융 산업 등의 신용 위험 관리의 질병 예측.
세 번째 계획, 등등 가격 실시간 지능형 회로 등 실시간 최적화 클래스입니다.
위에 다양 한 문학, 큰 데이터는 상상력의 일부를 사용할 수 있는 사실, 아마도 큰 데이터 것 들을 할 수 있는, 모든 측면에 확장 될 수 있습니다.
그러나, 현실, 어느 정도 큰 데이터의 실제 응용 프로그램에서 보고 우리가?
내가 생각 단 하나, 응용 프로그램의 실제 상용화를 달성 하기 위해 현재 큰 데이터 인터넷 마케팅입니다.
다른 방향으로 우리 앞에 나열 된 일부 초기 응용 프로그램, 하지만 기초 탐사 단계에 아직도 있다. 예를 들어, 발생 예측, 무담보 신용 대출, 정확성, 정밀, 확장성과에 아직 검사.
큰 데이터의 실제 응용 프로그램 및 목표 청사진의 차이 대 한 주된 이유는 데이터 원본의 문제는 생각입니다.
당신은 데이터를 적용 하기 전에 데이터를 얻을 수 있다.
따라서, 데이터의 가용성 특정 산업에 큰 데이터의 응용 프로그램 평가의 중요 한 차원 됩니다.
데이터 가용성 표준화, 개방 상태 및 데이터의 농도에서 여러 가지 차원에서 측정 될 수 있다
데이터를 얻은 후 동시에 응용 프로그램 데이터 효율성 개선, 비용 절감 또는 새로운 모델 생성을 포함 하 여 큰 데이터 응용 프로그램의 잠재적인 가치 차원에서 측정할 수 있습니다.
또한, 그것은 업계 뿐만 아니라 크로스-산업의 진흥에 큰 데이터 업계의 복제 가능/프로 모션 관점에서 측정할 수 있습니다.
3 차원에서 적용 위치, 하지만이 위치의 가능성을 다양 한 산업에 큰 데이터를 개인적으로 나는 매우 질적이 고 거친, 특정 또한 탐구 하 고 탐험 산업의 더 큰 데이터 응용 프로그램을 할 수 있습니다.
그들은 어떻게 큰 데이터 큰 데이터 응용 프로그램에 전문 기업
?
그것은 두 가지 차원에서 우선 개발 될 수 있다, 주요 작업 자체 인터넷 데이터와 대용량 데이터 기술 하위 응용 프로그램 프로그램, 기업 관점에서 첫 번째 숫자에서 두 리소스에 기반 하 고 다음 확장 산업 또는 심지어 크로스-산업의 관점에서 첫 번째 제품 출력의 응용 프로그램의 하위 데이터를 축적 하는 것 같아요 이 큰 데이터의 광범위 한 응용 프로그램으로 더 많은 데이터를 게이트웨이 될 것입니다.
하지만 한 가지 더, 플랫폼 형 인터넷 기업에 대 한 어떤 기업 또는 산업 데이터 조합, 큰 데이터를 적용 할 수 있습니다 몇 가지 필터 조건, 예를 들어 결정 플랫폼 속성의 사용 되지 않습니다, 그리고 또한,이 응용 프로그램은 복제 또는 프로 모션, 특정 기업에 제한 뿐만 아니라 적어도 그것은 산업 전반에 걸쳐 적용할 수 있습니다.
일부 논의 연구 위에, 큰 데이터 실용적인 응용 프로그램에 더 많은 친구 들과 함께 희망된 수 또한 일부 숙고, 큰 데이터 나 개인이 이다.
원본 링크: http://www.36dsj.com/archives/12536