투자 낭비를 방지 하 고 큰 데이터 10 큰 실수를 인식

출처: 인터넷
작성자: 사용자

현재 기술 뉴스를 지배 하는 큰 데이터 그리고 그것 침입 탐지 및 사기 방지 암 치료에 최적의 제품 가격의 설정에서 모든 문제에 가능한 해결책으로 선전 이다.

하지만 대용량, 여러 형식 및 모든 문제에 대 한만 병 통치 약 하지 않은 고속 데이터 정의. 사실, 큰 데이터 신화의 일부 주위 회사 미신, 그것 갈 수 있습니다 더 많은 시간을 낭비 하 고 잘못 된 방향으로 돈, 회사의에 영향을 미치는 시장 경쟁 위치, 또는 회사의 명예를 손상 하는 경우.

여기에 10의 가장 큰 신화 기업 큰 데이터에 대해 알고 하 고 그들이 효과적으로 큰 데이터의 부정적인 영향을 방지 하 고 정말 큰 데이터의 상업적 가치를 얻을 도움이 될 것입니다 이해 한다 있다.

큰 데이터의 10 오해를 인식 하 고 투자의 낭비를 방지

신화 # 1: 데이터 과학자만 큰 데이터를 처리할 수 있습니다.

사실, 데이터 과학자만 충분 하지 않습니다.

"스스로 데이터 과학자 정보 가져올 수 없습니다 큰 데이터에 대 한 만약 당신이 찾고, 첫 번째 질문" 팻 파렐, 펜 의학 데이터 분석의 수석이 사는 말했다. "당신이 이해 하는 문제는 고 어떤 통찰력이 특정 산업에 중요 한 산업 및 도메인 지식에 익숙한 사람이 필요 합니다." "

예를 들어 펜 의학 건강 시스템 및 의료 학교 포함 되어 있습니다. 오랜 동안 건강 시스템 데이터 창 고에서 임상 데이터를 수집 되었습니다. 동시에 대학, 새로운 기술 데이터의 큰 금액을 필요로 하는 인간 게놈의 연속을 허용 한다.

"우리가 알고 어디 값 이며, 우리는 마침내 그것을 액세스 하는 컴퓨팅 파워를 있다" 데이터 분석 및 예측 하는 건강 관리의 새로운 영역을 열어 의료 전문 지식을 결합 파렐 말했다.

신화 2: 더 큰, 데이터 값

파렐 말했다 수집, 저장 하 고 데이터를 카탈로그 필요한 시간과 자원, 그리고 그 많은 양의 데이터의 무차별 컬렉션 만들 수 있는 더 많은 가치 있는 프로젝트 및 리소스 수동.

파렐은 데이터 수집을 시작 하기 전에 그들의 특정 지표 또는 핵심 성과 지표에 대 한 명확한 이해를가지고 회사를 조언 한다.

대기업에 대 한 신화 3: 큰 데이터

큰 회사는 더 많은 데이터 소스 있을 수 있습니다 하지만 작은 기업 소셜 미디어 플랫폼, 정부 기관, 및 데이터 공급자에서 데이터의 활용할 수 있습니다.

"조직의 크기에 따라, 데이터에 따라 결정 단순히 직관에 의존 하는 것 보다 더 신뢰할 수 있는," 고 말했다. "대 린 Bartik, Dell의 소프트웨어 정보 관리 솔루션 부서에서 제품 관리의 고위 지도자 말했다.

데이터 기반 의사 결정을 그들의 동료 보다는 덜 자주 사용 하는 경향이 작은 회사 하지만 만약 그들이, 그들은 전략을 더 신속 하 게 해결할 수 있습니다.

신화 4: 수집 지금, 나중에 마무리

스토리지 점점 싸게, 하지만 그것은 무료. 브래드 피터 스, Birst, 샌 프란 시스 코에 본사를 둔 클라우드 기반 비즈니스 인텔리전스 회사의 최고 경영자는 많은 기업에 대 한 데이터는 성장 하는 스토리지의 비용은 떨어지는 것 보다 더 빨리 말한다.

일부 회사는 그들은 단지 데이터를 수집 하는 경우에, 그들은 나중에, 데이터를 사용 하는 방법을 찾을 것입니다 하지만 그것은 쓸모 없는 비용을 많이 지불 믿습니다. 사실, 일부 데이터 집합 체감의 법칙을 적용합니다. 예를 들어 당신이 선거 결과 예측 하는 여론 테스트를 실시 합니다. 당신이 대표 하는 표본의 얻을 유권자의 특정 번호가 필요 합니다. 하지만이 후 숫자 도달 특정 지점, 더 많은 사람들이 추가 크게 하지 않습니다 허용 오차에 영향을 미칠.

그리고 그것은 단지에 대 한 스토리지 비용, 딘 Gonsowski, Recommind 기업 정보 관리와 큰 데이터 관리, 샌 프란 시스 코에 본사를 두고, 글로벌 헤드 구조화 되지 않은 데이터 분석에 초점을 맞추고.

예를 들어 더 많은 데이터, 더 이상 그것을 정렬 됩니다. "수십억 레코드의 저장에 있을 때, 검색이 걸립니다 몇 시간 또는 몇 주." "그는 말했다.

신화 5: 모든 데이터는

버지니아 주 지난 20 년 동안 학생 등록, 재정 지원 및 인센티브 수준에 대 한 데이터를 수집 되었습니다. 그러나,이 데이터 수집 및 20 년 전 같은 데이터 필드에 저장 된 동일한 데이터 이어야 의미 하지 않습니다.

"내가 처리 했습니다 하는 가장 큰 문제는, 단지에 있기 때문에 데이터 사전, 연구원은 생각 한다 그것은 공정한 게임," 토 드 마사, 버지니아 주 등 교육 정책 연구 및 데이터 웨어하우징의 감독 말한다. "예, 법 및 토 학생의 시험 점수는 국가의 학생에 대해서만 수집 처음 다음 격차와 다음 데이터에서 수집 된 국가 다른 국가 학생 들. 마찬가지로, 다른 인종 K-12 수준에서 고 등 교육에 대 한 데이터는 또한 다릅니다.

사실, 어떤 특정 데이터를 시간에 다른 기관, 또는 다른 사람, 또는 다른 지점에서 보고 되는 달라질 수 있습니다.

결과적으로, 분석가 단지 통계 능력 뿐만 아니라 데이터의 현지 지식과 토 등 업계와 행위 점수 recalibrated 되의 전반적인 개발 동향 친숙 필요 합니다.

"이 모든 것이 들을 데이터 웨어하우스로 프로그램 수 없습니다." "토 드 마사 고 말했다.

같은 외부 데이터 원본에, 즉, 잘, 어떤 데이터를 사용 하 여 적용 하 고 문화 및 데이터 수집의 컨텍스트를 이해 해야 합니까.

신화 6: 보다 구체적인 예측 더 나은

인간의 본성 생각 보다 구체적인 것은 더 정확 하 고, 오후 3시 12분 약간의 시간 보다 더 정확 하다와 같은.

하지만 반대가 사실 이다. 많은 경우에, 더 정확한 예측 정확 될 가능성이 없습니다. 예를 들어 고객이 특별히 구성 된 노트북을 구입 하 고 노트북을 구입 하는 데 사용 되는 유일한 고객은 핑크 발뒤꿈치의 쌍.

"핫 핑크 발뒤꿈치의 추천 특정, 수 있습니다 하지만 그것은 너무 특정 하 고, 높은 오류 결과 수 있습니다" 제리 자오, CEO의 보존 과학, 산타 모니카, 캘리포니아 주에 본사를 둔 마케팅 회사를 말했다.

그래서, 일반적으로 보이는 아름 다운 것 들 수 있습니다 실제로 도움이 되지 비즈니스 및 마케팅 관리.

신화 7: 큰 데이터와 Hadoop

Hadoop, 구조화 되지 않은 데이터에 대 한 인기 있는 오픈 소스 아키텍처 최근 많은 관심을 받고 있다. 하지만 회사는 다른 옵션을가지고.

"모든 NoSQL 움직임은" SAP 큰 데이터 매니저 및 수석 부사장 Irfan 칸 말했다. "있다 mongodb, 카산드라 다른 완전 한 기술. "

이러한 기술 중 일부는 더 큰 데이터를 특정 프로젝트에 대 한 적절 한 있을 수 있습니다. 특히, Hadoop 병렬 처리에 여러 블록으로 데이터를 분할 하 여 작동 합니다. 이 방법은 그들의 전부는 아니지만 많은 큰 데이터 문제에 적용 됩니다.

"원사와 Hadoop 2 문제, 때로는 Hadoop은 이상적인 선택 하지 하는 방법으로 거래를 해야 해결" 하는 동안 Lucidworks, 최고 기술 책임자 그랜트 Ingersoll, 큰 데이터 컨설팅. "사람들이 필요 멋진 머리를 유지 하 그리고 당신을 위해 최상 인 무슨을 결정 하 고 유행에 따라. "

신화 8: 최종 사용자가 큰 데이터에 직접 액세스할 필요 하지 않습니다.

큰 데이터는 종종 전문된 직원에 의해 처리 될 너무 복잡 합니다. 하지만 그 경우 반드시 아니에요.

예를 들어, 중 환자 실에서 장비에 의해 생성 된 모든 데이터. 심장 박동, 호흡 데이터, 심전도 판독입니다. 하지만, 여러 번, 의사와 간호사만 환자의 현재 읽기 볼 수 있습니다.

"나는 10 분 전 상황 표시 되지 않습니다 다음 한 시간 이내에 추세선을 그릴 수 없습니다" 안토니 존스, 필립스 의료 환자에 대 한 의료 및 임상 정보에 대 한 최고 마케팅 책임자 말했다.

하지만 환자의 의사 결정에 대 한 기록 데이터를 볼 수 있는. "이 놈이 들은 핵심 데이터 과학 팀 그리고 그들은 거 대 한 기회를 놓치고 있어," 존스는 말했다.

문제는 지금 모든 상호 작용, 경우에 그들은이 목적을 위해 설계 되지 않았습니다 하 고 다른 플랫폼, 운영 체제 및 프로그래밍 언어를 사용 하 여 다른 장치에 의해 생성 된 데이터는 것입니다. 일단 당신이 이렇게, 의사와 간호사 얻을 수 있습니다 유용한 데이터 폼 필요할 때.

신화 9: 큰 질문 큰 데이터에 사용 되는

큰 은행 최고 정보 책임자는 최근 큰 데이터에 대 한 대화를 게시 하 고 최종 사용자 셀프 서비스 문제에 대 한 질문을 받았다.

"Birst 최고 경영자 피터 스 리콜." CIO는 말했다 "나는 그것을 믿을 수 없어"

이것은 일반적인 태도, 그는 말했다, 그리고 일부 경영진 생각 큰 데이터 응답 질문의 특정 종류만. 이 태도이 방법으로 요약 될 수 있다: "우리의 큰 데이터 목표 매우 적은 수의 데이터 과학자 팀의 코어를 통해 높은 가치의 문제를 해결 하는." 우리는 데이터를 혼동 하 고 서민에 액세스할이 정보 때문에 우리는 그들이 그것 필요 생각 하지 않습니다 싶지 않아요. "

피터 스, 하지만 그것은 많은 산업에서 일반적 이었다. "이것은 큰 보험 회사에서 만연 신화 하지만 비즈니스 사용자에 게 대처 하는 지혜를 필요가 없습니다." "

신화 10: 빅 데이터 거품 파열

기술 변화에 항상 주장 하지만 대 주기 앞뒤로, 갈 수 있습니다. 닷컴 거품의 파열은 인터넷의 끝 신호 아니다.

진정과 대 광고를 하는 경우에 회사는 큰 데이터와 거래를 해야한다 여전히. 사실, 지 수 성장, 때문에 그들은 예상 했 더 큰 데이터 처리도 전에 IDC는 2020 년까지 수집 된 데이터의 누적 금액 증가 의해 예상 보다 한 시간 2 년 마다.

그리고 그것은 단지 어떤 회사는 수집. 대신, 새 데이터 형식을 표시 하 고 저장소의 많은 요구 수 있습니다.

브라이언 힐, Cadient 그룹, 펜실베니아 인터랙티브 마케팅 회사, "빅 데이터" 단계만 했다 회사 그들의 사업에 영향을 미칠 수 있는 데이터 요소를 잡으려고 기회를 놓칠 수도 있습니다 말했다의 최고 기술 책임자.

"빅 데이터" 변경, 구름은 이전 웹 다른 것 처럼, "그는 말했다." 단어 변경 될 수 있습니다, 하지만 큰 데이터의 정신을 거기 남아 있을 것입니다. "

(책임 편집기: 유산의 좋은)

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.