맹목적으로 "시류에 따라" 하지 않습니다 당신은 충분히 큰 데이터를 이해?

출처: 인터넷
작성자: 사용자
키워드: 빅 데이터 지식 따라 시류 장 님

중간 트랜잭션 http://www.aliyun.com/zixun/aggregation/6858.html "> seo 진단 Taobao 게스트 클라우드 호스트 기술 홀

최근 몇 년 동안, 큰 데이터의 화제가 물결, 되었고 점점 더 많은 사람들이 큰 데이터 응용 프로그램에 대해 우려 하고있다. 전반적으로, 사람들은 큰 데이터의 기술 기능 등의 큰 데이터에 대 한 전망에 대해 낙관적 이며 4 "V"를 기억 하기 쉬운: 광대 한 (큰 숫자) 다양 한 (다양 한), 속도 (급속 한 성장) 및 값 (높은 총 가치). 이들은 좋아, 하지만 신중 하 게, 그들은 모두 큰 데이터의 긍정적인 장점을 향해 바이어스는. 하지만 사실, 큰도 큰 어려움, 큰 데이터 일부 부정적인 불리를 또한 필연적으로 있다. 이러한 부정적인 단점 4 포인트에서 요약 될 수 있습니다.

비정상적-큰 데이터는 지방. 큰 데이터는 더 많은 요인 간의 상관 관계의 분석에 대 한 어려움을 초래한 필드 변수의 수에 반영 하는 데이터 레코드의 행 수에만 반영 되지 않습니다. 심지어는 간단한 분산 분석, 하나 또는 두 개의 행을 계산, 계산 1 백 또는 2 백은 발굴.

구조화 되지 않은-큰 데이터 구조입니다. 큰 데이터의 구조는 매우 복잡 하 고, 같은 회전율, 시간 및 성별, 같은 다른 연속 변수 작업 유형, 전통적인 구조화 된 데이터와 이산 변수 등을 포함 하 여 또한 그러나 또한 다른 많은 구조화 되지 않은 새로운 데이터, 텍스트, 소셜 네트워크, 그리고 심지어 음성, 이미지 등 추가 이러한 구조화 되지 않은 데이터에 포함 된 정보는 종종 더 큰, 하지만 분석 방식은 약간 얇은.

불완전-대용량 데이터는 완전 하지 않습니다. 현실 세계에서 데이터 손실 사용자 등록의 불완전 한 정보 및 컴퓨터 데이터 저장소의 오류는 일반적인 현상입니다. 큰 데이터의 경우 데이터 손실 나중 분석 및 모델링 품질에 대 한 불확실성의 위험을 추가 하는 더 일반적입니다.

비정상적인-대용량 데이터 비정상 이다. 마찬가지로, 현실 세계에서는 꽤 몇 가지 outliers (국외 자) 큰 데이터에 있습니다. 예를 들어 (시간의 짧은 기간에 거래 금액) 등 일부 연속 변수는 너무 큰, 수평 값의 수에는 선택 된 제품 이름과 같은 일부 이산 변수 나타납니다 작은 등등. 그것은 계산 및 평가 모델 계수; 충돌할 가능성이 제거 되지 않으면 이 애 널 리스트는 딜레마와 함께 남아입니다.

고 대 공자 "따뜻하고 따라서 새로운 알고", 지금, 사람들 사용 큰 데이터 분석 추세의 현재 시대를 많이 분석 하 고 예측 할 수 있다. 하지만 어떻게 수 이러한 분석 데이터의 신뢰성을 보장할 수? 현재, 우리 나라의 큰 데이터는 개발 단계에 있는 경우 무조건 이러한 불리 한 요소를 처리할 수 없습니다 재생 어렵다 ""를 사용, 다음 큰 데이터 응용 프로그램 우월 추세에 따라. 정말 큰 데이터를 사용 하려면 정상적인 조건, 하지만 위대한 지혜를 필요로 하는 포괄적인 작업에서 데이터 분석의 간단한 업그레이드 되지 않습니다.

사실, 큰 데이터의 효과적인 사용 다양 한 잠재적인 위험을 실시간으로 모니터링 할 수 있는, 만큼 더 중요 한 것은 투자 반환 및 경쟁 우위를 향상 시킬 뿐만 아니라 급속 한 발전을 달성 하기 위해 글로벌 시장 잠재적인 비즈니스 기회의 다차원 판단에서 기업 수 있도록 통찰력을 많이 제공 하는 기업에 대 한 생산 효율 향상. 경우 없는 포괄적이 고 객관적인 이해 큰 데이터, 프로세스의 경우에 우리가 쉽게 할 수 있는 큰 데이터를 사용 하 여 예측 가능한 데이터의 많은 뿐만 아니라 정확도의 조금을 얻을?

따라서, 우리는 큰 데이터의 종합적이 고 객관적인 이해를 있어야 합니다. 신문에서 언급 한 4 개의 어려움은 또한 중요 하다. 다른 전략 전술을 채택, 빅 데이터 시대에 수 있는 다른 비즈니스 및 데이터 배경에 정말 큰 데이터의 활용을 재생, 효과적으로 운영 효율성을 향상 그리고 시장 경쟁력.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.