대용량 데이터 분석에서 격리 데이터: 당신이 그들을 볼 수 있습니다?

출처: 인터넷
작성자: 사용자
키워드: 큰 데이터 큰 데이터 빅 데이터 분석 빅 데이터 빅 데이터 분석 큰 데이터 빅 데이터 분석 참조 빅 데이터 빅 데이터 분석 말했다 참조 우리

기업과 cio 들은 데이터 마이닝을 시도 하기 시작, 이후 데이터의 섬 비즈니스 인텔리 전스의 효율성의 개선을 방해 했다. 데이터, 즉, 비싼, 선 필요가 데이터베이스를 유지 하지만, 서로 호환 되지 않습니다의 섬 불가능에 의심의 여지가, 그들 로부터 훌륭한 지식을 발견 하 예상 된다. 즉, 데이터베이스 수 채굴은 지식의 양 관련이 상관이 있다. 한 비즈니스 인텔리전스 전문가 말했듯이 들어오고 나가는 쓰레기입니다.

빅 데이터 분석에 관해서-또는 데이터 3V (카테고리, 숫자와 성장 속도), 그것은 대부분의 기업이 된다는 화두. 때문에, 애 널 리스트 테드 프리드먼에 따르면, 데이터 아일랜드는 확산 기 하 급수적으로 그냥 전염병 처럼.

"있다 당신의 회사에 있는 데이터의 섬 든 지, 어디서 나. 큰 데이터 관점에서 전체 우주는 데이터-'구름'에 웹 방화벽에서의 제도와 홍수 및 다른 기업에서 오는 데이터, 고객 및 공급 업체, "말한다 프리드먼, 누가 호스트 정보 관리 컨설팅." 모든이의 하면 더 뜨 섬 데이터를 의미 있는 지식 정보를 활용할 수 있습니다. "

그럼 어떻게 CIO 합니까 큰 데이터 해석에? 처럼 그것은 비즈니스 도전 다른 발생이 수수께끼 및 그것의 솔루션 돌고 있는 인재, 프로세스 및 기술. CIO 요구 뿐만 아니라 직원 (를 포함 하 여 모집 데이터 과학자, 분석가 및 건축가, 등), 새로운 기술을 개발 뿐만 아니라 상단 설득: 큰 데이터 거 버 넌 스와 심지어 보드 관심을 필요로 하는 중요 한 법안 이다.

갑자기 유행 되는 데이터 관리

큰 데이터, 즉, 격리 분석 및 혁신에 초점에서에서 격리 하는 데이터의 문제를 해결 하는 방법이 있다. 가트너는이 방법을 사용 하는 정보 평가 과정에서 전문. "데이터의 광대 한 바다, 다른 데이터는 다른 값, 데이터 마이닝의 목표는 어떤 종류의 문제, 공간과 공간, 다음 심층 분석의 정의 된다 그래서" 프리드먼 말했다, "내 생각에, 고객은 너무 광범위 한 분석 경계를 정의 하 경향이 있습니다." "

초점, 회사 수 있습니다 스스로 게 물어 첫 번째 질문: 우리는 데이터 얻을 것은? 이 데이터는 우리의 비즈니스에 어떻게 관련 됩니까? 어떻게 우리가 긍정적인 반환을 얻으려면이 데이터를 사용 합니까?

회사는 점점에 초점 그 기업이 더 많은 노트 큰 숫자, 가트너에에서 숨어 데이터 값 데이터 거 버 넌 스 위원회를 설정 시작 합니다. 모든 측면에 초점을 비즈니스 이해 관계자 들로 구성 되어-중요 한 데이터 소스, 데이터 품질, 데이터 보존, 데이터 통합, 데이터 보안 및 개인 정보 보호 정보 등 다양 한 데이터와 관련 된 문제를 어떤 기술 투자에서.

외부 데이터의 섬의 위험한 탐험

IT 전문가의 소수, 뿐만 아니라 권리 큰 데이터를 큰 데이터에서 가치 극대화를 탐험 다른 직원에 게 공개 되어야 합니다. 가트너와 다른 전문가 걱정 많은 조직 큰 데이터에서 이익을 서두르고 있다 지배 그것의 위험을 무시 하 고 등등 위조 데이터 개인 정보 보호 위반에 대 한 형벌을 지불.

"사업, 철저 한 데이터 개방" 현실 되지 않습니다, 말한다 Boris Evelson, 포 레스터, 매사 추세 츠. 수석 애 널 리스트 "있다 다양 한 규제 문제 및 관심의 충돌." 예를 들어, 절대적으로 투자 은행의 측량 및 상인 사이 단일 단계를 만들 수 없습니다입니다. "

데이비드 Gallaher, NSIDC 말한다 데이터의 무결성을 보호 하는 것은 거 대 한 도전, 콜로라도의 대학 국가 눈 연구 데이터 센터 (NSIDC)와 데이터 수집 파트너 미 항공 우주국 (NASA)에서 IT 서비스 관리자. 데이비드의 주요 작업 수집 하 고 세계의 모든 고정된 영역을 기록 하는 과학적 데이터의 페타바이트를 관리 하 고 그들은 연구자를 제어 방식으로 필요에 배포 했다 되도록 했다. "우리가 사람들이 그들이 필요로 하는 데이터에 대 한 가능한 한 쉽게 만들 필요가 하지만 우리는 변경할 수 없습니다 그들의 무차별, 다는 것을 확인 하 는" Gallaher, 지리 교육을 받은 사람을 말한다. 다른 한편으로, NSIDC 과학자 들은 데이터를 액세스할 때마다 그들을 업데이트 데이터 관리의 지배 원리는 "맞은 사람들 변경 오른쪽" 해야 합니다, 그래서 Gallaher 강조 했다. NSIDC는 현재 데이터 거 버 넌 스 원칙을 구체화 하는 국립 과학 재단 협력.

데이터 관리-다중 뷰 하지 다중 복사로

모두가 동의 큰 데이터 데이터의 더 섬 뜻합니다. Anjul Bhambhri, IBM의 빅 데이터 프로젝트에 큰 데이터 실제로 "수" cio 들은 주장 한다.

"이제, 데이터의 섬 수 스스로 청소," Bhambhri 섬, 매년 200 개 이상의 기업에 대 한 데이터를 정리 하는 인터뷰에서 말했다. 13 데이터 마트 메일 보관 설정 대기업 (8 법률 담당 부서에 의해 사용 되었다) 때문에 그들은 그들은 보관 된 메일에 액세스할 때 처리 될 그것을 위해 기다릴 수 없습니다. 다른 회사의 두 부서 자체 웹 캐시의 복사본을 했다. "당신은 알고 그들은 하루 거래 15 십억 캐시," Bhambhri 말했다.

새로운 기술-제품 포함 하 여, 물론, IBM의 큰 데이터-저장 하 고 분석 하는 엄청난 양의 데이터를 단일 데이터 웨어하우스에 기업 허용. 그 결과, 두 회사는 데이터 보관 유지만, 필요 없이 13 보관 된 복제본 또는 15 십억 웹 설정 캐시. "데이터는 한 곳에만 저장 하 고 데이터 스토리지 계층 구조에서 변경 되지 않은 상태로 보관 되기 때문에 여러 응용 프로그램에서 동시에 데이터에 액세스할 수" Bhambhri 말했다. 그러나, 그녀와 그것을 적극적으로 옹호 하는 그녀 처럼 큰 데이터 분석 사람들, 비록 그들은 끊임없이 상기 회사 효과적인 대용량 데이터 분석 기존 IT 시스템 프레임 워크의 철저 한 정비를 요구 한다. "올바른 방향으로 큰 단계는 효과적으로 데이터를 저장할 수 있게 되 고," 그녀는 말한다, "하지만 그것을 저장 하는 것은 충분 하지 않습니다, 그리고 효과적인 분석 알고리즘을 많이 필요 합니다." "


TechTarget 중국 원본 콘텐츠, 원본 링크: http://www.searchcio.com.cn/showcontent_65230.htm

(책임 편집기: 루 광)

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.