큰 데이터는 거품은 역사의 피할 수 없는 개발

출처: 인터넷
작성자: 사용자
키워드: 큰 데이터를 할 수 있는 우리는

2013 년 11 월 7 일, 그것은 주간 및 국가 Cio/cto 클럽, "발견" 2013 큰 데이터 및 베이징 새로운 세기 호텔 닛코 3 그랜드 이벤트에 모바일 응용 서밋 포럼 시간 IT 비즈니스 뉴스 네트워크에 의해 후원.

회의 큰 데이터 기반 솔루션 그것을 탐구 하 여 큰 데이터 응용 프로그램의 비즈니스 가치를 발견 하는 것을 목표로. 국가 기업 및 기관의 CIO, 유명한 인터넷 기업 CTO, 국가 하이테크 파크 대표, 제 3 자 시장 조사 기관 대표, 공동 사무실 필드, 애플 리 케이 션 개발자 대표, 정보 전문가 및 다른 업계 유명 인사 주제에 참여 하 고 공동으로 대용량 데이터, 모바일 인터넷 생태계 건설 탐험을 초대 합니다.

리 우 청, SAS 소프트웨어 중국 회사의 제너럴 매니저

리 우 청, SAS 소프트웨어 중국, 연설을 전달의 제너럴 매니저 받을 "큰 데이터와 대용량 데이터 분석 기술"는 다음과 같이 읽는다:

안녕하세요 모두 들, 오늘 주최자. 큰 데이터 그리고 큰 데이터 분석 기술의 초대장 주셔서 대단히 감사 합니다. 큰 데이터가 2 년은 매우 뜨거운, 하지만 그의 비즈니스 응용 프로그램 매크로 더 얘기, 특정 기술적인 측면의 아주 작은 이야기, 그래서 오늘은 큰 데이터 항목에 대 한 이야기를 기술 관점에서.

큰 데이터 당신이 무엇을 듣고, 또는 일부 사람들이 말하는 거품 처럼, 사실 그것은 피할 수 없는 역사적인 발달. 당신이 볼 수 있는 그것의 전반적인 개발에 기술, 첫 번째 PC 기본 소프트웨어 다음 데이터베이스, ERP, 관리 자동화, 이러한 기술을 지속적으로 개발, 하 모두는 인터넷에 개발, 그리고 마지막으로 개발 결과 많은 데이터를 축적 하는 것입니다 볼 수 있습니다. 그래서 모든 측면에서이 단계는 매우 성숙,이 단계에서 지금 이다.

또한, 우리의 기술 중 일부는 또한 데이터의 많은 거래를 할 수,이 대형 데이터는 진짜, 라고 한다 하지 슬로건.

이전, 우리는 이것에 대해, 어떤 사람들 말 Google의 개념은 논쟁, 누가 나오는 개념, 지금 큰 상관 없이 데이터는 진짜, 이제 양의 전 세계 데이터 1.8BP에 대 한 업계의 모든 측면에 관여. 우리 정치 경제를 배울 수를 사용, 우리 모두가 알고 생산 요인 등 생산 자원, 인력, 자본, 그리고 지금 우리는 데이터와 생산 수단의 가치 생산 요인으로 동일시 말할. 그는 투자 전문가 이지만 결코 기술 산업에 투자, 그는 그가 더 많이 알고 있는 대 한, 맥도날드 등 전통 산업에 투자 그리고 코카콜라, 하지만 최근에 그는 기술에 달러의 1 십억을 투자 했다. 그는 단어,이 괴짜의 데이터 기술을 이해 조심.

올해 상반기에 회의 대 한 미국에 갔을 때 미국에서 20 회사 큰 데이터를 신청 했다 고 그 큰 데이터 분석은 미국에서 더 성숙 한 사람이 말했다. 지난 11 월 24, IBM의 500 소매 비즈니스 데이터 분석, 그 분석, 하지만 이러한 수요를 볼가 서 아무리 우리를 미국에서 말하는 그 분석을 위해 함께 너무 많은 데이터를 넣을 수 있습니다, 그리고 표시 되는 데이터 샘플 크기 보다 과거에 훨씬 큽니다.

하나는 프리즘 계획, 우리 인지 더, 여기 좀 더 자세한 소개를 하는 방법 몇 가지 핵심 포인트를 다양 한 색상의 숫자를 해야 할 이러한 핵심 포인트에 따라 경고 신호 수준을 나타내는. Facbook의 시각적인 감각 같은 것 점이 하 고, 우리 핫 스폿 위치를 볼 수 있습니다. 시각화는 매우 큰 데이터에 중요 합니다.

계획의 노출 데이터에서 경쟁으로 이어질 수 밖에 없다. 데이터 분석은 정말 중요 하 고, 국가 안보를 포함 하 여 볼 수 있습니다. 데이터 분석 기법 및 데이터 분석가의 수준 어느 정도 것, 국가의 경쟁 우위를 결정 하 고 국가 대 한 전략적 문제.

같은 시간에 우리는이 기회를 우리가 할 인터넷 이나 컴퓨터 시대에 일자리를 많이 만들 참조 하십시오.

기술 이나 기술 수준에 관해서, 하나 분석의 모델은, 우리가 해야 할 매우 복잡 한 모델 시뮬레이션 결과를 복잡 한 계산을 통해 그렇게 몇 가지 계산 분석. 이제 샘플 크기는 하지만, 성장 더, 비록 하지 전체 샘플, 샘플은 상당히 큰.

분석 속도: 분석은 정말 천천히, 10 백만 행의 데이터를 과거의 소프트웨어 그리 오래, 지금 1 십억 행 데이터의 초에 분석 될 수 있다 지금, 몇 시간 동안 실행 될 수 있습니다, 그리고 이것은 새로운 기술 개발의 결과 이다. 시간 변경, 데이터 기술, 처리 하는 능력으로 서 그것은 할 수 있다 큰 데이터는 상대적 개념 이다. 분석 할 수 있는 지금 비교 데이터 분석, 가난한, 그래서 정확 하 고 매우 정확 하 게의 서식 없는 텍스트의 서식을 지정 하는. 그러나 오디오 및 비디오의 우리의 분석은 여전히 상대적으로 초기 단계에 약한. 그것을 더 많은 데이터 샘플 미래에 우리가 분석 하 고 분석을 위해 그들을 혼합 하는 방법에 대 한 큰 도전 이다.

다른 법률 규정 이다입니다. 예를 들어 귀하의 개인 정보, 국가 안보 문제의 공용 데이터 분석을 통해 이것은 불법? 많은 입법에 의해 해결 해야 하는 데이터 소유권의 문제 이기도 합니다.

데이터 보안: 데이터는 손상 하는 경우 분석 결과 편견 확실히 것입니다, 몇 가지 문제가 있다. 때 미국 보조 섬 원자력 공장을, 아니 지진 이었고 사실 몇 년 전 알려졌다 지진 이었고 키 데이터가 추가 되었습니다 발견 했다.

물류 데이터 분석은 사물, 실시간 분석 결과 후 수집 된 데이터의 인터넷의 데이터 분석 적시 도움 사용자에 게 제공할 수 있습니다.

데이터 관련: 지금은 너무 많은 큰 데이터, 관련 된 유용한 데이터 상대적으로 작습니다. 또 다른 큰 데이터 확률 이론으로 이어질 수 있습니다? 큰 데이터 일부를 과거에 해결 하기 어려운 되었습니다 더 과학적 문제 해결 우리를 도울 수 있습니다.? 우리가 알고, 예를 들어 데이터에 의해 태양계와 행성을 찾을 수 있습니다.

10 동향: 기술적으로 하나는 높은-성능 컴퓨팅, 영상 분석, 클라우드 컴퓨팅, 미래 모델은 데이터 나이 소프트웨어는 또한 구름과 함께, 클라우드 소프트웨어를 사용 하 고 데이터 베스트 수 다른 장소, 그래서 그것은 더 사용 하기 편리. 다른 관리 과학을 포함 하 여 광범위 하 게 사용 됩니다, 방법은 정부에 있는 변화를 포함 하 여 힘과 기업 결정. 큰 데이터 사람들이 생각 하는 방식을 변경 하 고 음 교수 케임브리지. 큰 데이터에 미치는 영향에 대 한 사람들의 생각에 책을 볼 수 있습니다. 또 다른 비즈니스 모델 및 검색의 조합 이다. 우리는 우리가 정말 원하는 찾을 수 검색 엔진 및 데이터 분석을 결합 한다.

다른 군대의 변화 이다입니다. 미래의 의사 결정의 속도, 의사 결정의 정확도 데이터 분석, 필요 달성 하기 위해 몇 가지 소프트웨어를 필요 합니다. 미래에, 그것은 정량화의 자동 판단을 실현 하는 군대의 개발의 방향입니다. 정부 수 더 추세를 제어, 이해 여론 하 고 정보를 통해 사람들을 안내. 우리는 빅 데이터에 대 한 얘기를 하기 전에 여기에 큰 데이터 기술이 이다.

전통적인 분석 기술의 퍼즐 이란 무엇입니까? 과거에는, 데이터 회의 많은 문제를 가져왔다. 이제 새로운 빅 데이터 시대, 분석 소프트웨어, 하드웨어 플랫폼 및 데이터 변경, 그래서 우리가 하 고 있는 데이터 분석은 같은 과거에는, 사실, 과거 비즈니스 모델은 또한 오래 된, 우리 미래의 생각할 수 있어야 새로운 비즈니스 모델, 비즈니스 모델은 무엇입니까? 그것에 대해 생각할 수 있습니다. 데이터는 과거의 구조적 데이터, 하지만 많은 수의, 결과, 반 구조화 된 제한 된 데이터, 다른 장소, 데이터 바인딩을 수행 하는 방법 및이 저장 된 비 구조 데이터 고려 될 것 이다.

또 많은 수의 데이터를 분석 하 고, 또한 메모리 계산 등을 지원 하기 위해 그리드 컴퓨팅 지원 수 소프트웨어입니다.

데이터 분석 개발 진화 다이어그램: 기본 파일을 플래시 파일, 현재 데이터 분석을 하 고 클라우드 컴퓨팅에서. 단일 스레드 및 다중 스레드 그리드 컴퓨팅의 개발의 처음부터

대용량 데이터 분석을 해야 합니다-고성능 컴퓨팅, 높은-성능 분석이이 작품의 개발을 지원할 수 있습니다.

전반적인 아키텍처 패턴: 우리 때 우리는 큰 데이터 분석 소프트웨어를 하 고이 지원 할 수 있어야 합니다. 높은-성능 분석을 입력 한 후 얼마나 많은 속도 증가, 하드웨어 방식에 따라 데이터 분석의 1 십억 행 10 시간 20 시간, 이제 4 멋진 시계를 완료할 수 있습니다 제공할 수 있습니다 과거에 볼 수 있습니다.

분석 모델: 데이터 분석, 데이터 라이브러리, 디스플레이의 결과의 분석에서에서 추출 됩니다, 이제 데이터가 없는 경우 데이터 전송은 정말 네트워크 대역폭에 의해 영향을, 라이브러리, 데이터의 분석에 직접 찍은 만큼 출시, 도서관 수 데이터를 분석, 이것이 전송 되는 데이터 보다 훨씬 더 빨리 합니다.

그것은 약 1 분 했다 과거에서 일을 할 이제 우리 96 작업을 할 할, 1, 48 96 일 걸리는 약 96 분, 지금, 96 다른 일만 필요 2, 3 분 할 다른 장소에 넣어. 따라서, 분산 컴퓨팅의 계산 속도 크게 향상 됩니다.

하드 드라이브에서 데이터를 삽입 하려면 Word 문서를 열 때 속도가 느립니다. 하지만 끊임없이 변화 하는 문서로 word의 메모리에서는 커널에 있는 데이터의 계산을 생각 하지 고. 우리가 결합 그리드 분산 컴퓨팅 데이터 분석을 할 커널 분석, 데이터 분석 속도가 크게 향상 됩니다.

시각화 도구 도움 더 복잡 한 데이터를 이해 하 고 영상 데이터의 시각화를 확장할 수 있습니다 이제는 모델, 모든 데이터 마이닝, 데이터 분석, 그리고 다른 솔루션 수 수 수는이에 따라 코어 플랫폼 평면.

우리는 하드에서 데이터를 넣어 시각적 분석 데이터에 대 한 준비 하실 수 있습니다, 이제 메모리 매우 빠른 속도로, 두 번째 계산의 수준에 도달 모두에, 드라이브.

그리고이 이걸 보고서로 디자인 될 수 있다, 세계, 및 지원 모바일 웹 페이지를 통해이 보고서를 볼 수 있습니다.

데이터 분석 기술 한다 또한 데이터 관리 기술, 데이터 분석, 클라우드 컴퓨팅, 이것이 미래의 모델을 결합 해야 합니다. 이제는 기술적인 접근을 특정 제한이 있습니다. 미래 분석 소프트웨어는 구름에 수 고이 패턴은 앞으로 개발 되어야 한다.

회의에서 미국에서 당신은 앞으로 버전 1.0의 데이터 분석에 대 한 개념을 넣어 2.0, 3.0 지금 우리는 구조적된 분석, 1.0은, 우리가 생각 하는 큰 데이터 2.0, 미래에 다양 한 데이터 분석을 혼합 3.0으로 볼 수 있습니다.

마지막 생각: 우리 사업과 모든 측면에 대 한 서비스에 대 한 큰 데이터를 사용 하 여이 기회를 포착 한다. 감사합니다!

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.