전자 상거래, 소셜 미디어와 모바일 인터넷의 상승 및 모바일 스마트 디바이스의 인기 많은 데이터의 폭발적인 성장을 발생 있다. 큰 데이터의 진정한 가치, 많은 전통적인 기업 할 생각, 작동 모드, 기술, 등, 큰 데이터 웨이브 세례. 그러나, 관련 재능의 부족 여전히 큰 데이터 제약 조건을 길들이기 전통적인 기업 이다.
2014 중추가을, 친구 또는 친척 또는 그들의 자신의 소비에 대 한 선물 인지를 달 케이크의 어떤 브랜드 되 고 사람들이 문제에 초점을 많이 선택 합니다. 8 월의 끝에, 중국 통계 정보 서비스 센터 (CSISC) 큰 데이터 연구소 발표 "2014 중국 mooncake 브랜드 구두의 연구 보고서." 브랜드 인지도, 소비자 상호 작용, 품질 승인, 기업 명성, 제품 평가, 브랜드 건강 및 달의 등 6 차원에서 보고서 케이크 브랜드의 명성과 올해의 죄수.
나는 큰 데이터 구조를 기반으로, Csisc의 보고서 mooncakes, 사는 사람들에 대 한 중요 한 참조 하며 Mooncake 엔터프라이즈의 관점에서 그들의 브랜드 명성 관리에 대 한 좋은 참고 자료를 제공 한다 말하고 있다. 그것은 지난 몇 년 동안에서 "기저귀와 맥주"의 경우, 달 케이크의 브랜드 명성의 보고서에 왔다 분명 큰 데이터 기술 외국 개념에서 더 실용적인 로컬 응용 프로그램을 이동 하는.
빅 데이터 기술 원동력
몇 년 전 많은 사람들이 걱정 했다 큰 데이터 다른 될 것 이라고 그것은 개념을과 대. 자, 기자 발견 큰 데이터 기술 HDFs와 Mapreduce, Hadoop, 표현 뿐만 아니라, 자사의 오픈 소스 구성 요소 hbase와 하이브, 큰 데이터 오픈 소스 기술 중 일부는 점차적으로 되 고 널리 배운 및 개발자에 의해 적용. Hadoop 소프트웨어 생태계 전망, IDC, 발행 시장 확대 되 고 빠른 속도의 60% % 년에 보여준다. IDC 시장 2016 년 813 백만 조의 빠른 속도로 성장 기대.
사실, 큰 데이터 사람들 사용, 통신 및 모바일 인터넷을 사용 하는 과정에서 존재 한다. 사람들이 끊임없이 하고있다 데이터를 다음 사용 데이터, 데이터에서 값을 가져올 및 다음 큰 데이터 기술 수요의 급속 한 발전을 운전. 그것은 할 수 있다 큰 데이터 기술을 차례로 계속 데이터를 생산 하 게 대용량 데이터 분석의 결과 동시에 구동 하는 데이터입니다.
Hadoop, 나타내는 큰 데이터 기술, 주로 그것의 선진된 기술 때문에 넓은 관심을 얻고 있다. 이러한 기술은 확장성, 고성능, 및 대규모 시스템의 고 가용성 문제에 좋은 해결책 대기업, 특히 대형 인터넷 기업, 해결 해야 하는 문제입니다.
기술적인 관점에서 주요 원동력을 하는 이러한 큰 데이터 기술 탄생에서 성숙은 기업의 실제 수요 이다. 비즈니스의 관점에서 더 많은 사람들이 이러한 새로운 기술을 알고 인터넷 시대에 지식 전송 속도 오픈 소스 지역 사회 개발은 또한 새로운 기술의 개발에 참여 하는 자본의 힘 또한 이러한 새로운 기술 완성도 상용화를 빠르게 운전 하는 동안 더 많은 사람들이 수 있습니다.
Feng Dazhi, 클라우드 베이스 큰 데이터 회사에서 수석 컨설팅 매니저 넣어 앞으로 두 관점. 한편으로, Hadoop의 뛰어난 분산된 스토리지 및 컴퓨팅 기능 규모와 전통적인 기업에 대 한 데이터 마이닝의 효율성 증가 했다. Feng Dazhi 예를 들어, 잘 알려진 보험 회사를, 거의 100 백만 고객 고객 클러스터링, 고객 이탈 모델, 보험 상품의 관련성 분석의 전체 볼륨을 달성 하기 위해 전체 데이터 분석의 기반으로 합니다. 또한, 유지 보수 비용을 고려 하지 않고 기존의 스토리지, 작은 기계, 관계형 데이터베이스 조합, 비교, Hadoop으로 표시 하는 큰 데이터 기술에는 성능과 가격의 몇 가지 장점을.
Feng Dazhi 따르면 국내 모바일 회사의 시스템은 수십 수백 노드, 시스템 자체의 비용에 거의 큰 데이터 웨어하우스 시스템으로 작은 단체의 설정 또는 비용의 작업은 매우 높습니다. Feng Dazhi 그 같은 대형 시스템은 전통적인 기술 시스템 및 가격 시스템을 두 번 도전.
큰 데이터 값 보다는 더 많은 기술
여론의 분석에 큰 데이터의 중요성 우선, 생각의 변화에서 및 작동 모드 이며 둘째는 기술 개선.
여부는 정부 또는 기업 여론, 네티즌 분석, 인터넷의 조회의 관리에 인터넷 회사에서 배워야 한다고 생각 하 고 여론을 관리 하. 작업 모드에서 기술, 정부 및 기업 더 많은 데이터를 얻을 수 있습니다 및 시각화, 대용량 데이터 분석을 사용 하 여 또한 변경할 수 있습니다 기존의 여론 관리 모드.
직장에서 그의 실무 경험을 바탕으로, 바이, 기관장 상하이 증권 거래소의 "귀족"의 데이터 처리 솔루션을 개척 하 고.
전통적인 기업의 IT 시스템은 종종 "귀족" 특성 있다: 구입 비용이 비싼 유지 비는 비싼, 플랫폼 마이그레이션 비용이 더 비싸요. 과거에는,이에 안전 작업의 큰 압력 아래 전통적인 기업 "귀족"과 "귀족" 사이의 선택, 프로그램의 가치를 강조 하기 위해 "귀족" 해결책의 종류.
큰 데이터 기술의 진정한 가치 수 있습니다. 지속적으로 데이터 처리의 제한에 영향을 줄 뿐만 아니라 또한 일반적으로 비 제한 상황에서 데이터 처리의 비용을 줄일 수 있습니다.
반면, 일부 엔터프라이즈 IT 직원이 IoE (IBM, Oracle 및 EMC) 제품에 사용 되어 있고 갑자기 개발 및 운영, 자주 느낌, 낯선 익숙해 하지에 따라 오픈 소스 기술에 그들을 보자. 또한, 전통적인 엔터프라이즈 데이터 처리 시스템 운영 하고있다 10 년 이상, 그것의 기술 범주 보다 더 직원 여전히 핵심으로 원래 IT 시스템에 내장 된에 대 한, 가장 중요 한 것은 다양 한 인프라의 라이프 사이클은 매우 긴, 신기술을 균형 해야 합니다. 이 관점에서 큰 데이터는 대조 "귀족 병"에 전통적인 기업의 제거, 조직의 비즈니스의 통합에 더 공헌 데이터 및 기타 리소스, 관련 직원 들의 열정을 동원 수 노력의 가치를 극대화 하.
남자는 큰 데이터의 첫 번째 드라이버 이다.
Hadoop 나타내는 큰 데이터는 작은 코끼리, 기업 트레이너 그것을 길 들 수 있는 필요 합니다. 많은 기업 등 대용량 데이터 기술을 포용, 큰 데이터 기술에 능숙은 재능 큰 차이가 됩니다. Wugansha, 인텔 중국 연구소의 수석 엔지니어는 사람들이 큰 데이터의 첫 번째 드라이버는 연설에서 말했다.
Forrester의 최근 보고서에 따르면 대부분의 기업이 기존 데이터의 12%만 분석 하 고 나머지 88% 완벽 하 게 악용 하지가. 이유는 대용량 데이터 분석 능력의 부족은이 상황의 주요 원인입니다. 자, 전통적인 기업 보다 몇 가지 혁신적인 데이터 분석 및 인터넷 회사의 무거운 짐 및 큰 데이터 관련 기술 인력의 부족 있다.
Yianyang, 중국 국립 증권 정보 기술 부의 제너럴 매니저 살롱에서 회사 "가 귀족" 데이터 웨어하우스 오픈 소스 시스템 (Greenplum)와 함께에서 되는 산업에 대 한 모델을 구축 2008 년에서 경량 범용 하드웨어 플랫폼 사용 했다. 그러나, 동시에 Yianyang "피곤된" 한숨도 발행.
태양 Yuanhao는 스파크 재능의 숙련 된 사용에 대 한 현재 시장 이므로 상대적으로 부족 하 고, 회사 자체 스칼라 프로그래머를 개발 하 고 개발자를 촉발 하는 말했다. 하지만 리 우 청 또한 SAS 복잡 한 재능을 필요로 했다: 한편으로, 다른 한편으로, 하 둡의 분야에서 기술 회사 향상 된 분석 및 통계 분야의 전문가 SAS 훈련 프로젝트에 그들의 자신의 재능에만 주장 수 있습니다 그래서.
전통적인 기업, 많은 개시 기업이 나 인터넷 기업와 달리 그들은 많은 기록 데이터를 필요가 없습니다, 코어 팀은 더 기술 전문가, 큰 데이터 기술 사용 하 여 장점이.
Teradata 회사 더 큰 중국 대형 데이터 부문 디렉터 의사 소통, 다양 한 전통적인 기업에서에서 홍콩 Yuhua는 많은 기업이 사용 하 고 연구를 할 둡 및 응용, 발견 또한에 국한 스토리지, 전처리 및 몇 가지 기본적인 웹 분석.
그리고, 이제는 하 둡 기술은 빠르게 성장 하 고, 사용자가 자주 새로운 기술, 새로운 문제 및 특정 문제를 해결 하는 전통적인 비즈니스 요구를 위한 조금 느립니다 하 둡 오픈 소스 커뮤니티에 갈 필요가 발생.
그래서 지금 많은 기업 데이터 분석, 데이터 마이닝 응용 프로그램 Hadoop 플랫폼에서 정말 하는 두 가지 옵션, 실현 하기 시작 하는 데이터의 어느 지식 분석 이해, 프로그래밍 및 작동, 또는 성숙한 큰 데이터 플랫폼을 출시 하는 상업 회사 선택에 기술 팀의 기술 이해.