데이터를 기 하 급수적으로, 성장 하 고 소셜 미디어 (마이크로 크레딧, 마이크로-블로깅) 및 센서 장치에서 구조화 되지 않은 데이터 증가 관심, 거래 시스템, 산업 변화의 새로운 라운드를 이어질 수 있는 전통적인 기업에서 구조화 된 데이터를 받았습니다. 기계 학습, 자연 언어 처리, 및 여론 분석, 미디어에 거의 매일 보고는 하지만 몇 가지는 정말 그들의 대규모 응용 프로그램에 대 한 이야기.
오늘, 기업 Cio에서 거의 모든 사람들이 큰 데이터에 대해 얘기 하 고 많은 사람들이 생각 하는 큰 데이터를 Hadoop 클러스터에 모든 데이터를 저장 하 고 다양 한 API 호출을 통해 분석 하는 곳. 그러나 대답은 하지 너무 간단 하 고,, 큰 데이터는 연결 된 프런트 엔드 응용 프로그램 중간 계층 인프라에서 그것의 모든 측면. Hadoop은 모든 것, 큰 데이터의 일부 이며 우리가 정말 큰 데이터를 활용 하는 더 많은 것 들에 대해 생각할 필요가.
우리의 데이터에 대 한 문제는 무엇입니까?
사실, 우리가 해결 하려고 하는 큰 데이터와 함께 기본적인 문제는 저장 및 보고. 우리가 빠르게 성장 데이터를 저장 하는 방법을에 열쇠는 액세스할 수 있습니다 신속 하 게 기업 들이 필요로 할 때 이다. 임시 쿼리 보고서를 생성, 비즈니스, 예측 고 숨겨진된 값 이용 하 여 큰 데이터 스트림을 합니다.
데이터의 어떤 종류 들이 있나요? 관계형 데이터, 구조화 되지 않은 데이터 또는 오디오 비디오? 어떻게 서로 다른 형식의 데이터를 저장 하 고 사람들이 조직 내에서 해당 데이터에 액세스할 수 있도록? 대답은 구름에서, 클라우드 스토리지 기술을 기본적으로 대용량 데이터의 저장소 요구 사항을 해결할 수 있는, 모든 형식의 데이터를 저장 하 고 쉽게 확장할 수 있습니다. 높은-엔드 SAN 스토리지 기술 빅 데이터 시대에 구식 그리고 높은 비용 엔터프라이즈의 경제성을 넘어. SAN 스토리지는 중요 한 비즈니스 데이터에 적합 하 고 각 레코드는 기업에 매우 중요 하다. 판매 주문, 결코이 데이터 수 등 반대에 큰 데이터 손실 되며 microblog 또는 로그 파일은 너무 높은 요구 사항. 클라우드 스토리지 서비스, 화 웨이 등 아마존, 신뢰성, 확장성 및 비용-효율적인 기업을 위한 대용량 데이터 스토리지 솔루션을 제공 하기 위해 저렴 한 장치를 사용할 수 있습니다.
물론, 텔레비전의 출현은 대용량 데이터 시대에 경우 처럼 라디오 방송국, 둠 하지 않았다. 아직도 san 값, 하지만 모든 데이터가 있다. 우리는 데이터의 종류는 특수 한 저장소 요구 사항 때문에 스토리지 클라우드 필요. 예를 들어 읽기 데이터는 일반적으로 관계형 데이터베이스를 필요, 로그 파일 수 사용 HDFS 저장소만, 쓰기 작업의 다량을 요구 하는 데이터, NoSQL 데이터베이스 필요 있고 많은 수의 시스템 읽기 작업 필요 합니다 그들을 지원 하기 위해 강력한 대용량 데이터 아키텍처. 시스템은 낮은 대기 시간, 높은 일관성, 신뢰성, 또는 각각의 의미는 다른 저장소 솔루션 제어 스토리지 비용, 필요 필요할 수 있습니다. 높은 일관성 거래 시스템 구축을 의미 낮은 대기 시간 SDD 또는 메모리 장치를 의미할 수 있다, 그리고 높은 신뢰성 데이터베이스 복제 기능을 사용 하 여 의미 합니다. 그래서, 큰 데이터 조합에 "Sihai" 관계형 데이터베이스 시대, 오라클 + 소형 + 하이 엔드 스토리지 (IOE) 작별 하지 못한 모든 데이터 문제를 다루는 했다.
그래서 기업 필요 합니까? 대답은 이러한 다양 한 스토리지 요구 사항을 충족 하는 서비스 방식으로 제공 하는 유연 하 고 확장 가능한 클라우드 스토리지 솔루션. 아마존의 Rds, dynamodb, 등 화 웨이 개체 클라우드 스토리지 등. 물론, 모든 클라우드 스토리지 수요를 만날 수 있는, 기업에 더 많은 유연성 필요 하며 대기 시간 준수 등 이유로이 신속 하 고 쉽게 다른 시스템에서 공용 클라우드를 내부 시스템에서 또는 다른 한 클라우드 공급자에서 데이터를 마이그레이션할 수 있습니다.
비즈니스 인텔리전스 및 ETL의 미래 발전
스토리지 솔루션, 뿐만 아니라 우리가 또한 프런트 엔드 응용 프로그램에 집중 해야. 전통적인 ETL 또한 변화를 받게 된다. 비즈니스 사람들이 확실히 그것에 게 조금 여분의 데이터를 가져오려면 부서 변경 스키마 싶지 않아요 그리고 너무 많은 작업 및 비용. 이상적인 상태가 비즈니스 사람들이 임시 쿼리, tableau, 이러한 문제를 해결 하기 위해 할 수 있는 간단한 도구를가지고. 그러나, 데이터의 볼륨 성장 하 고 결핵 이나 데이터의 심지어 페타 바이트 처리 해야, 소프트웨어의 비용 계정으로 이루어집니다.
ETL 및 BI 도구의 미래 웹 쪽에서 실행 되 고 어떤 사업 사람 보고서를 생성 하기 위해 그것을 사용할 수 있습니다. 데이터 쿼리를 완료 하는 데 동적 HTML5 사용자 인터페이스를 끌어올 수 있습니다 하 고 보고서 생성, 비즈니스 사용자를 훈련 해야 하는 경우 정말 밖으로 다음이 도구를 사용할 수 있습니다.
차세대 BI 도구는 구름에 저장 하면서 실시간, 그래픽, 대형 개체 및 구조화 되지 않은 데이터를 다룰 수 있습니다. 각 데이터 형식에 서로 다른 클라우드 서비스에 호스트 될 수 있습니다 하지만 API를 통해 액세스할 수 있습니다. 클라우드 서비스 공급자를 저장할 데이터의 종류에 대해 걱정할 필요 없이 비즈니스를 처리할 수 있습니다.
마지막으로, 그것은 중요 하다. 점점 더 많은 기업 데이터 분석 "전략적 무기"의 일종 되고있다 실현 하기 시작 합니다. 비즈니스 거 인의 다음 세대 데이터를 수집 하 고 귀중 한 통찰력으로 그들을 변환 하는 방법을 알고 있는 회사에서 태어난 수 있습니다. 시작, 기업의 큰 데이터를 저장 하는 방법을 해결 하기 위해 필요와 대용량 데이터 분석 모델을 작성 하거나 기계 학습과 데이터 과학자 모집에 투자 하기 전에 구름에 대답은.
원본 링크: http://www.searchbi.com.cn/showcontent_82331.htm