부탁 하거나 거부, 큰 데이터는 사실 되고있다. 이제 우리는 사실에 다시가 서 진실을 탐구 하는...
큰 데이터 일의 가장 뜨거운 주제 중 하나 이며 우리 중 누구도 그것에 있을 수 있습니다. 몇 년 구름 처럼 전, 빅 데이터 시장에서 광범위 한 우려가 발생 했습니다 그리고 회사 큰 데이터 정의를 위한 긴급 한 필요가 있다. 큰 데이터 표준 및 보급 정의 적어도 하지로 널리 구름의 NIST의 정의로 부족 합니다.
조사 기관인 IDC의 정의 더 쉽게 받아들여질 수 있습니다. 큰 데이터의 정의: 기술과 효율적인 캡처, 검색 및 분석 기능, 데이터 마이닝 뛰어난 값의 복잡 한, 큰 숫자의 형식에서 경제적으로 수 아키텍처의 새로운 세대.
큰 데이터는 다양 한 회의에서 중요 한 문제가 되고있다 그리고 임원들이 신흥 동향에 밖으로 놓치지을 꺼리고 있다. 큰 데이터 기술 미래 기업 드라이브 비즈니스 가치 추가에 사용할 수 있는 정보의 광대 한 금액을 분석 하려고 할 때 사용 될 것입니다 의심의 여지가 있다.
다른 한편으로, 다른 새로운 트렌드와 마찬가지로 많은 사람들이 큰 데이터의 유용성을 의심 한다. 사실, 기술 될 때 광범위 한 논쟁의 초점, 일부 의심과 비판 반드시 발생 합니다.
두 가지 관점 대용량 데이터의 중요 한 가치에 대 한 있다. 그러나 일반적인,, 점은 두 보기 큰 데이터에 대 한 몇 가지 오해 하 고 큰 데이터의 특성을 보이지 않게입니다.
오해
신화 1: 빅 데이터만 거 대 한 숫자를 의미
이름 "빅 데이터"는 데이터베이스의 크기는 문제가 본질적으로 오해입니다. 하지만 그것이 유일한 요인은 아니다. 앨런 프리스틀리, 감독의 전략적 마케팅 인텔 유럽, 중동 및 아프리카 (EMEA), 큰 데이터의 다른 요소, 특히 데이터 형식 및 데이터의 빠른 납품을 위한 필요의 복잡도 주장 한다. 또한, 기업 또한 데이터의 정확성을 이해 처음으로 필요 합니다.
신화 2: 소셜 미디어는 가장 중요 한
큰 데이터에 대 한 토론의 많은 기업에 소셜 미디어 데이터의 영향에 집중 된다. 미디어의 대부분 고객 으로부터 최신 정보를 얻기의 전통적인 사업에 초점을 이해 하기 어려운 일이 아니다. 지금, 그것은 소셜 미디어 상호 작용, 트위터, 페이 스 북, 베 지 밀-그램, 및 등등을 찾고 의미 합니다. 그러나, 프리스틀리 지적 가장 일반적인 기업 블로그, 데이터 센터 로그 및 기타 정보를 포함 하 여 시스템에서 생성 된 데이터입니다.
"항공 산업 이제 사용할 수 있습니다 또한 큰 데이터의 힘," 라고 말합니다. 예를 들어 그들은 사용 하 고 항공 여행 분석 수 있습니다.
발생 가능한 문제를 예측 하는 데이터입니다. 과거에는, 그들은 비행 또는 실패의 시간 후에 엔진을 확인 했다. 아무도 일 오류 싶어하지만 너무 늦기는 충돌 후까지 엔진을 확인 하. 대용량 데이터 분석, 그들은 엔진의 진동을 추적할 수 있습니다. 생성된 된 데이터를 검토 하 여 그들은 경보를 발행 하 고 데이터는 비정상적인 것을 발견 하는 검사 엔진을 일정을 수 있습니다. "
예를 들어, Priestley는 또한 BMW 큰 데이터를 이용 하는 방법에 성공적으로 설명. BMW의 자동차의 많은 수는 3 세대 기술을 통해 인터넷을 액세스할 수 있습니다. 큰 데이터 및 관련 된 분석 기능을 사용 하 여 BMW이 자동차를 추적 하 고 소유자에 게 연락 수 있습니다. 물론, 예, 사기 거래를 실시간으로 확인할 수 있는 원격 구매 거래는 법적, 그리고 이러한 작업의 모든 단 몇 초 걸릴 수 있도록 신용 카드 회사 등의 여러 가지가 있습니다. 인텔 자체 또한 큰 데이터 기술의 중요 한 사용자입니다. 회사 대형 데이터를 사용 하 여 웨이퍼 제조 공장, 극적으로 비용 절감 및 폐기물 감소의 혜택을 제어.
신화 3: 큰 데이터는 둡
큰 데이터 토론의 많은 Hadoop에 집중 된다. 아파치 프로젝트는 물론 가장 높은 프로 파일, 그리고 그것은 첫 번째 도구를 분석 하 고 그것에서 값을 얻기 위해 구조화 되지 않은 데이터를 저장. 그러나, 유일한 도구가 아니다. 프리스틀리는 말했다: "어떤 사람들은 그 만큼 Hadoop의 사용에 대해, 걱정을 아무것도 실제로, 일반적인 데이터 웨어하우스 아직도 있다 공간 생각." 사람들은 그들의 기존 IT 인프라 유지 해야 합니다. "
프리스틀리 포인트는 Hadoop의 매력 기업만 작은 오버 헤드 정보를 많이 얻을 수 있습니다. 그는 덧붙였다: "둡 아파치, 표준 서버에서 실행 될 수 있는 프리웨어 소프트웨어를 다운로드할 수 있습니다." 또 다른 대안은 Oracle 또는 Teradata 등 회사에 대 한 통합된 솔루션을 구매 것 이다. 하지만 많은 기업 들이 되지 않을 수도 있습니다 실행 가능한 옵션이 그들은 데이터를 분석 하 여 얻을 수 있는 이점을 충분히 인식 하지 않는. "
신화 4: 투자 수익 (ROI)을 측정 하려는
회사 같은 하드 숫자. Cio는 일반적으로 큰 데이터 마이그레이션 비용 X, 3 년만에 y를 저장할 것 이다 라고 싶다. 사실, 큰 숫자는 없습니다. 그것은 매우 투자 (수익 ROI) 큰 데이터 계획에서 분명 수익을 얻을 어렵다입니다. 프리스틀리의 포인트, 큰 데이터 구현의 많은 수는 "가상 정보"를 정의 하기 어렵다.
고객 관계 관리 (CRM) 기업에 미치는 영향을 신속 하 게 측정할 수 있습니다. 하지만, 달리 큰 데이터를 채택 하려는 회사 차이 동의 해야 합니다. 또한, 회사 생각 투자에 대 한 주요 프로젝트에 (ROI)를 반환 하는 방법 변경 될 것으로 보인다. 과거에는, 기업 투자 수익은 항상 쉽게 측정 될 수 있는 유형 자산 그리고 비즈니스 이점을 지출의 비용을 초과에 바운스 되었다 믿 었 다. 하지만 변경 하려면 시작 하는 것 들.
최근, claranet 기업에서 클라우드 마이그레이션의 조사. 결과 응답자의 1 / 4 이상 본 투자 수익 결정 요인 중 하나로 79% % 투자 수익 계산 비즈니스 이점을 반영 하지 않았다 생각 하는 동안 나타났다. 조사 클라우드 마이그레이션에 초점을 맞추고, 큰 데이터 마이그레이션 다른 많은 되지 않을 것입니다 추측 하는. 둘 다 미래에 기술적 도약을 나타냅니다.
신화 5: 결과 보장 되지 않습니다.
큰 데이터를 알 수 있습니다. 무엇을 하 고 막대 하 고 결정 하기 어려운 숫자 분석 이다. 본질적으로, 큰 데이터를 이해 하거나 추상적인 쉽지 않다. 그렇지 않으면, 큰 데이터 기술이 필요는 없습니다. 따라서, 기업 결과의 정확성을 보장할 수 없습니다 그들은 깨 달아야 한다. 그것은 결과 얻을 수와 가상 지원 데이터를 찾을 시도 하는 기업에 대 한 무의미 하다입니다. 위의 예제에서 항공사 항공기 일단 모든 500000 비행 시간, 하지만 만약 비행기 충돌 200000 시간 마다 유지를 할 수 있습니다, 그리고 항공사의 비전 의미가 있을 것입니다.
큰 데이터에 대 한 몇 가지 오해가 있다면 빅 데이터에 대 한 주요 사실의 일부 심각 하 게 큰 데이터에 너무 낙관 하지 않은 회사에 의해 이해 될 필요가 있다.
주요 사실
사실 1 키: 다른 기술이 필요
대부분의 전문가 들은 데이터 과학자의 부족 동의 한다. 2019 년, 맥킨 지 예측, 세계 될 것입니다 짧은 큰 데이터로 190000 과학자까지. 이유는 찾기 어렵습니다. 기존 데이터 웨어하우스 로부터 완전히 다른 과정을 필요로 큰 데이터 항목 처리
기술이 필요 합니다. 그리고 그것은 데이터 처리에 국한 되지 않습니다 하지만 또한 실용적인 추천으로 데이터를 변환 하는 기능을 요구 한다.
"하 둡 맵 리듀스 라고 불리는 도구가 있다. 자바를 프로그래밍 기술 되지 않은 많은 데이터 분석가의 기술 오늘 필요 합니다. 예를 들어 프리스틀리입니다. 그리고 그것은 그 이상 이다. 큰 데이터 작업을 하는 이상적인 사람 또한 비즈니스 프로세스, 자바, 그리고 통계를 이해 하 고 심지어 일부 SQL 기술을 요구할 수 있습니다. 이것은 큰 문제 이다, 그래서 많은 사람들이 동의 데이터 과학자의 부족 큰 데이터 기술 채택 하는 중요 한 장애물이 될 것입니다.
사실 2 키: 당신의 목표를 식별
회사는 결과 탐험 하려고 한다, 하는 동안 그들은 기업의 목표와 달성 될 목표에 대해 명확 해야 한다. 케이스
예를 들어 한 대형 데이터 성능을 향상 시킬 수 있는 방법은 개인 데이터, 고객 행동를 포함 하 여 더 정확한 정보를 수집 하 여 구매 결정
정책입니다.
맥킨 지 회사 숫자 했다 엄청난 발견. 비즈니스 컨설팅 주장 미국 의료 업계는 큰 데이터를 사용 하는 경우
미국의 건강 보험 비용 8% 삭감 될 것 이다. 또한, 맥킨 지 언급을 사기 소송 증가 세금, 유럽 공개 여
부서 운영 효율성 100 십억 유로 저장할 수 있습니다.
중요 한 사실은 3: 남자는 운전 요인
큰 데이터 프로젝트를 밀어 사람이 필요 해. 기술은 중요 한 문제가 되지 않습니다. 이 과학자는, 위에서 언급 한 데이터의 능력을가지고 사람들을 하지만 그 사람을 넣을 수 있습니다 앞으로 명확한 목표 요구 결정을 구현할 수 있습니다을 참조 하지 않습니다.
이 사람들은 특별 한 관리 기술이 필요 하지 않습니다. 이러한 책임 재무 책임자 (CFO), 최고 정보 (CIO), 또는 심지어 최고 경영자 (CEO), 최고의 어깨에 떨어질 수 있습니다 하지만 결국에서 한 사람이 책임을이 필요 합니다. 프리스틀리가 지적한 대로: "빅 데이터는 단지 기술에 도전, 그것은 비즈니스 도전." 기업은 이것을 이해 해야 합니다. 이 사용 패턴은 매우 중요 합니다. 이와 관련, 기업의 다양 한 패턴, 그리고 다른 방법으로 모델을 가질 수 있습니다. "
중요 한 사실은 4: 데이터 뿐 아니라
대용량 데이터 분석은 세 가지 주요 요소: 자체 데이터, 데이터 분석 및 결과의 프레 젠 테이 션. 자체 데이터를 소유 없는 실용적인 의미의 이다. 데이터 자체는 이미 존재합니다. 그것은 처리 하 고 분석 하 고, 중요 한 값으로 데이터를 변환 하는 데 중요 한 정보를 제공 해야 합니다. 큰 데이터 프로젝트의 개발 주의 깊은 계획이 필요합니다. 그것은 작은 시작 하 고, 단일 프로젝트를 구현 하 고 다음 점차적으로 최대 규모 최고의입니다. 자세한 결과 분석은 데이터 수집 후 필요 합니다.
사실 5 키: 큰 데이터 전체를 커버
큰 데이터의 토론의 많은 큰 조직에 초점을 맞추고 그리고 숨 죄이 고 대량의이 큰 관료에 대 한 데이터는 조직의 효과적인 기능 제한 했다. 큰 데이터 기술을 채택 하는 최초의 단체의 많은이 범주에가 하지만 그들은 유일한 수혜자 되지 않습니다.
모든 종류의 기업의 숨겨진된 데이터를 평가 하 고 패턴을 유도 하는 능력을 얻을 싶어요. 일부 중소 기업 산업 데이터의 대용량 처리를 해야 합니다. Formulaone 디자인, 예를 들어 작은 하지만 너무도 중소 기업 그들의 매일 일에 있는 많은 양의 데이터를 사용 하 여 혜택을 누릴 수 엄청난 양의 데이터를 관리.
이 회사는 고객을 분석 하 여 고객 구매 패턴을 찾고 Excel을 넘어 할 수 있습니다. 예를 들어 레스토랑 메뉴에는 특별 한 물고기를 했다 취소 되었다. 그래서 다시 사용 하 여 고객에 대 한 메뉴에이 요리 나타나면 전에 요리를 주문한 모든 고객을 알리기 위해 이메일을 사용할 수 있습니다. 또는, 그 양조, 재고 목록에서 와인은 와인 상인 인 경우 그리고 와인 애호가 생각나 게 수 있습니다 때 그들에 대 한 라이브러리에서와 서.