키워드:클라우드 컴퓨팅 빅 데이터 hadoop mapreduce bigdata 비즈니스 인텔리전스 MPP 클라우드 컴퓨팅
페이스 북은 사용자가 지금 750 백만 이상 있고 하루 주식 수 4 십억에 도달 했다 발표 했다. IDC 예측 2020 2009 년, 데이터의 총 금액 35ZB 44 시간 증가 합니다 (Zettabyte), 데이터의 80%는 구조화 되지 않은 데이터입니다. Bigdata 규범적인 정의 없이 개념 이기도 하 고 다른 응용 프로그램 큰 데이터의 다른 해석이 있다. 큰 데이터를 새로운 시대를 열었습니다, 여부는 결론을 끌기 위해 상 조 수 있습니다 하지만 그것은 거 대 한 영향 우리가 그것을 무시 하는 것은 허용 하지 않습니다. Informatica의 엔터프라이즈 데이터 통합 제품 관리 감독 청, 그녀 공유: "빅 데이터는 두 가지 특성, 첫째, 데이터 특성 구조화 또는 반 구조화 된 데이터, 두 번째, 데이터 생성 빈번한 상호 작용, 대규모 데이터 분석 및 실시간 통합 비즈니스 데이터 마이닝을." "동시에 추가 하 는"만 크기 순서 일정 새로 고침의 큰 데이터를 대표 하지 않는다 이다.
큰 데이터의 기술적인 해체
이러한 두 가지 특성에서 그 큰 데이터 포함 거래 및 모든 데이터의 대화형 데이터 집합 규모 또는 일반적인 데이터베이스 또는 비즈니스 인텔리전스 기술 캡처, 관리 및 처리 기능 보다 훨씬 복잡에서 볼 수 있습니다. 일부 회사는 이미 사업, 세 가지 주요 기술 동향의 큰 데이터 구성 청에가 출 데이터 증가의 영향을 느낄:
1. 큰 트랜잭션 데이터: 전통적인 관계형 데이터와 구조화 및 반 구조화 된 정보 온라인 트랜잭션 처리 (OLTP) 및 데이터 웨어하우징 응용 프로그램 응용 프로그램 ERP에서에서 분석 시스템에서 성장 하 고. 이러한 상황은 더 복잡 한 기업 공공 및 민간 구름에 더 많은 데이터 및 비즈니스 프로세스를 이동 된다.
2. 큰 대화형 데이터: The 힘 새로운 구성 되어 소셜 미디어 데이터의 페이 스 북, 트위터, 링크 드 인 및 기타 소스에서 있습니다. 그것은 포함 하는 기록 (CDR), 장치 및 센서 정보, GPS 및 지리적 위치 매핑 데이터를 관리 되는 파일 전송 (관리 파일 전송) 프로토콜을 통해 전송 되는 대량 이미지 파일 텍스트를 웹 및 클릭 스트림 데이터, 과학 정보, 전자 메일, 전화 등등.
3. 대규모 데이터 처리: 다 수의 출현 아파치 하 둡, 오픈 소스 및 상용 하드웨어 클러스터에서 실행 등의 데이터 처리를 위한 아키텍처를 양산 했다. 기업에 대 한 도전은 신속 하 고 안정적으로 데이터에 액세스 하 둡에서 비용 효율적인 방식 이다.
최근 5500 참가자, Hadoop 포럼에서 개최 하는 미국에서 입장권 개통 후 8 시간에 밖으로 판매 되 고 있다. 하 둡 분산 파일 시스템, MapReduce 알고리즘, 병렬 처리 (MPP) 데이터베이스 기술 대규모 구글, 페이스 북과 다른 인터넷 회사에 의해 처음 개발 되었다. 오픈 소스 기술 Hadoop 이제 실험 시작 많은 엔터프라이즈 수준의 사용자를 끈다. 이전 비싼 대규모 병렬 처리 및 대규모 데이터 분석 기술에 비해, Hadoop 큰 데이터 응용 프로그램을 배포 하 더 비용 효율적이 고 비용 효율적인 방식으로 사용할 수 있다. "결합 하 여 전통적인 트랜잭션 데이터 통찰력 및 비즈니스 가치를 얻기 위해 새로운 대화형 데이터를," 청, 예를 들어 말한다: "기업 사용할 수 있습니다 소셜 미디어 고객의 환경 설정을 이해 하 고 개선 대상 마케팅 효율을 개선 하기 위해 고객 데이터를." "
대용량 데이터에 대 한 응용 프로그램 플랫폼
비즈니스 관점에서 기업 데이터 통합, 비즈니스 인텔리전스 큰 데이터 환경에서는 필요 하지만 그들의 규모가 거 대 한 수준에서 데이터 통합을 위한 인프라 더 전성 해야 하는 동안. 올해 6 월에서 인포 큰 데이터, 이것은 세계의 첫번째 통합된 데이터 통합 플랫폼의 큰 숫자에 대 한 전용 청에 대 한 Informatica9.1를 시작 했다. "이이 플랫폼의 개발 목표는 매우 명확 하 고, 그것은 기업 사용자가 큰 데이터의 비즈니스 잠재력을 발휘 수 있도록 Informatica 데이터 통합 기술에 기반," 청 말했다: "에 관련 된 정보를 얻기 위해 모든 사용자의 능력을 향상 시키기 위해 셀프 서비스를 통해 제어를 유지 하기 위해 IT 부서에 기초 하 여 데이터 통합 플랫폼 데이터 서비스를 적용할 수 있는, 관련된 데이터와 신뢰할 수 있는 데이터를 비즈니스 요구에 따라 조정 얻는 비즈니스 통찰력 및 일관성을 제공 합니다. "
큰 데이터의 특성에 대 한 응답, 인포 9.1 데이터 통합의 세 가지 측면에서 혁신적인 솔루션을 제공합니다. 첫 번째는 큰 트랜잭션 데이터에 연결 하 고 높은 볼륨 트랜잭션 데이터에 대 한 액세스를 제공 하기 위해 OLTP 온라인 분석을 통해 데이터를 저장할 수 있는 새로운 데이터 웨어하우스 장치 패키지입니다. 둘째, 새로운 소셜 미디어와 함께 큰 대화형 데이터에 연결할 커넥터를 사용 하 여. 페이 스 북, 트위터, 링크 드 인, 및 기타 미디어 등의 데이터 원본에 액세스 합니다. 장비 및 센서, CDR, 대용량 이미지 파일을 포함 하 여 엔터프라이즈 업계의 신흥 값 데이터 집합에 데이터 컬렉션의 범위를 확장 됩니다.
셋째, 플랫폼의 연결 기능 대규모 데이터 처리를 지 원하는 데 사용 됩니다. Hadoop에 서로 다른 소스에서 데이터를 입력 하 고 탐구 하 고 내 데이터 응용 프로그램, Hadoop에서 데이터 품질에 대 한 계산 하실 수 있습니다. 대화형 데이터 내부 및 외부 기업에 대 한 통찰력을 제공 하기 위해 Hadoop 시스템의 더 나은 관리.
"우리의 고객, 주요 전문 패션 유통 업체의 현지 백화점, 네트워크와 그들의 우편 주문 카탈로그를 통해 우리의 고객에 게 서비스를 제공" 청 컴퓨터에 대 한 성공 사례: "회사는 고객에 게 차별화 된 서비스를 제공 하 고 싶어을 회사의 차별화를 찾는 방법 트위터와 페이스 북에서 사회 정보를 수집, 그들은 화장품, 마케팅 모델에 대 한 자세한 배운 고 다음 두 가지 유형의 귀중 한 고객을 유지 했다 그들은 깨달았다: 높은 소비자와 매우 영향력 있는 사람들. 희망 무료 메이크업 서비스를 수락 함으로써 사용자가 단어의 입 주의이 트랜잭션 데이터 및 대화형 데이터 완벽 한 조합, 비즈니스도 전에 대 한 솔루션을 제공 한다. "컴퓨터의 기술 도움 소셜 플랫폼, 더 많은 타겟, 그의 비즈니스 서비스에 대 한 데이터와 고객 마스터 데이터를 풍부 하 게 매장" 이라고 말했다.
이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이
페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.
커뮤니티에서 표절 사례를 발견한 경우
info-contact@alibabacloud.com
으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.