도대체 큰 데이터 입니까?

출처: 인터넷
작성자: 사용자
키워드: 빅 데이터 우리는 무엇을 통해

대용량 데이터에 대 한 통로가 있다:

"빅 데이터는 10 대 섹스 처럼, 그것에 대해 모두가 회담, 정말 아무도 그것을 할 당신은 모든 다른 사람?? ing 그것, 그래서 모두가 주장 하는 그들은 그것을 하 고 있다. "

이 문장을 참조 할 사람들이 야 큰 데이터는의 기본 개념? 현재, 대용량 데이터의 이해를 많이 아직도 유지: 슈퍼 대규모 대규모 데이터 데이터 양의 데이터의 PB 수준, 심지어 EB, ZB 수준에 도달 했습니다. 이러한 데이터의 심층 분석을 통해 우리는 최고의 결정을 기업 가이드 매우 중요 한 결론을 얻을 수 있습니다.

큰 데이터는 많은 사람들이 들어 본 또는 읽기에 대 한, 문서의 종류 특정 한 것이 뭔지 모르겠다 하지만.

사실, 지금 http://www.aliyun.com/zixun/aggregation/14294.html "> 큰 데이터 데이터의 엄청난 양의 더 정확 하 게는 대용량 데이터 분석의 방법." 전통적인 데이터 분석 가정 하 고 다음 해당 데이터를 취득 하 여 가설을 확인 하는 것입니다. 그리고 큰 데이터 다른 채널, 데이터 간의 상관 관계를 찾고 직접 분석, 데이터의 형식에서에서 이러한 알고리즘을 통해 대규모 데이터의 컬렉션에서, 큰 데이터를 하지 않습니다. 간단한 기간에서는, 큰 데이터 검색과 주기 근사 추측/확인 하는 과정에 더 집중 경향이 있다.

큰 데이터 값은 분석 및 그것의 사용에서 구현 된다. 모두 함께, 대용량 데이터의 병목 데이터 규모, 하지만 프런트 엔드 데이터를 수집 하 고 최신 비즈니스 결정에 있는 모델 및 알고리즘 문제에 이르게 데이터 구조화의 방법으로 인 한 스토리지 및 운영 문제 아니다.

데이터를 생성 하는 모든 산업 그리고 현대 사회에서 데이터의 볼륨은 전례 없는 속도로 증가 하 고 있다. 이러한 다양 한 유형의 데이터 및 데이터 형식이 매우 복잡 하 고, 구조화, 반 구조화 및 구조화 되지 않은 데이터를 포함 하 여 있습니다. 기업 통합 하 고 기업에서 내부 및 외부 데이터를 포함 하 여 정보의 복잡 한 전통 및 비 전통적인 소스에서 데이터를 분석 해야 합니다. 센서, 스마트 장치 기술과 사회 공동의 폭발적인 성장과 함께 데이터 형식 텍스트, microblogging, 센서 데이터, 오디오, 비디오, 및 등등을 포함 하 여 계산 하기 어려운 된다.

그리고 지금 큰 핫 데이터 분석 작업을 수행 하는: 정보 수집, 구조화, 그리고 마지막으로, 우리는 큰 데이터의 마법의 힘. 하지만 문제는 데이터와 함께 할 너무 많은 일 이다. 인터뷰 및 전문가 예측, 데이터 분석의 50% ~ 80% 시간 데이터 처리에 보냈다.

모니카 Rogati, 턱 뼈 회사에서 데이터 작업에 대 한 책임은, 말했다:

데이터 작업은 전체 작업의 큰 부분. 하지만 때로는 우리가 좌절 때문에 우리는 데이터에 협력 하 여 모든 것을 다하고 것 같습니다.

이 소리는 조금 빙산 이론을, 어디 우리는 빙산 그리고 무엇 우리가 볼 수 없어, 큰 데이터의 선행 작업 등의 작은 코너 볼 큰 데이터는 바다의 큰 부분을 좋아한다.

그러나 맥킨 지 컨설팅, 2011 년 보고서에서 밝혔다.

"데이터는 관통 모든 산업 및 비즈니스 기능 영역으로 오늘, 생산에 중요 한 요소가 되 고 있다." 발굴 및 대규모 데이터 응용 프로그램 생산성 성장 및 소비자 잉여의 새로운 물결을 나타냅니다. "

네, 문제가 있는 장소에 숨어 기회 또한 있다. 원래 데이터 형식 및 소스 계산 되지 않습니다, 그리고 예를 들어 식품 비즈니스를 수집 하 고 대용량 데이터를 분석 하는 경우 그것은 수집할 수 날씨 보고서 출력, 발송에 대 한 위치 정보를 포함 한 데이터, 매일 소매 판매, 소셜 미디어 리뷰, 등등. 이 정보를 바탕으로, 기업 및 다음 해당 제품 계획 개발 시장 방향 및 수요 변화에 대 한 통찰력을 얻을 수 있습니다.

사실, 더 많은 정보, 더 나은 결정을 내릴된 수 있도록 기업 이다. 하지만이 결정은 데이터를 다양 한 센서, 문서, 웹 페이지, 모두는 다른 형식에는 및 소프트웨어 그들을 이해 하 고 그들을 분석할 수 있도록 일정 한 형식으로 변환 해야 합니다 데이터베이스에서에서 데이터의 다른 세트에 기반.

데이터는 인간의 언어로 퍼지, 일부 데이터 인간 알고 그것은 무엇을 의미 하지만 그래서 우리는 작업을 반복 반복 컴퓨터, 그것을 인식할 수 없는 때문에 모든 종류의 데이터, 서식을 지정 하는 심각한 도전 이다.

이미 여러 시각적으로 같은 clearstory 데이터를 다른 데이터 소스를 식별 하는 소프트웨어를 개발, 팔로 알토에서 시작, 그들을 통합 하는 것은 결과 렌더링, 이것을 완화 하는 기술을 개발 하는 신생의, 차트, 그래프, 지도 데이터 등이 있다. Paxata, 데이터 자동화 발견에 초점을 맞추고 캘리포니아 시작 처럼, 저하와 데이터-수 처리 하는 paxata 데이터를 통해 다양 한 분석 또는 시각적 소프트웨어 도구에 먹이.

큰 데이터의 현재 상황 컴퓨터 개발의 궤적 다소 비슷합니다. 만 몇 엘리트, 하지만 시간이 지남에, 지속적인 기술 혁신 및 투자,이 기술을, 또는 도구를 통해 마스터 종종 처음은 첨단된 기술을 더 잘 될 것입니다. 상업 분야에 통합 하는 경우에 특히이 도구 널리 사용 되 고 사회의 주류 될.

그래서 우리는 지금 역사의 증인 어떻게 큰 데이터 단계, 우리 모두가 필요 마스터 또는 큰 데이터의 값을 더 발굴을 최적의 분석 방법을 선택 보고.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.