큰 데이터의 큰 자동 데이터 마이닝의 진정한 의미

출처: 인터넷
작성자: 사용자
키워드: 아주 아주 아주 큰 데이터

이제 큰 데이터 화재 좋지 않다, 거의 모든 사람들이 큰 데이터를 얘기 하지만 큰 데이터 란, 내가 얼마나 많은 사람들이 알고, 너무 많은 사람들이 잡 초 무서 워 요.

큰 데이터 데이터의 많은 아닙니다.

"빅 데이터"은 단순히 짧은 이름, 요점은 "http://www.aliyun.com/zixun/aggregation/14185.html" 해야한다 고 말했다 있기 때문에 큰 데이터에는 너무 많은 데이터를 저장 하지 > 대용량 데이터 마이닝, 큰 데이터를 파낸 하지는 원유 채굴 하지는.

큰 데이터는 데이터 마이닝 일반적 의미를 의미 하지 않는다.

많은 사람들이 데이터 분석 하는 데 사용 또는 데이터 마이닝, "빅 데이터 시대" 책이 나왔을 때, 큰 데이터를 시작 하는 때, 그들은 큰 데이터 전문가 바 뀌. 그래서, 필요는 없습니다 하지만 그것을 넣어 그것은 항상 존재 하기 때문에 큰 데이터를 언급 하는 경우 또 다른 방법은. 그것은 우리가 오늘 "H2O 음료" "물 마시는" 대신 말할 필요가 없습니다. 음, 그래, 그 이라고 개념을 재생 합니다.

"빅 데이터 마이닝" 실제로 언급 하지 않았다, 그리고 완전 한 지점 "큰 데이터 자동 광업." 해야 합니다.

이전 데이터 분석 이나 발굴, 분석, 나중에 사용에 대 한 것 들의 몇 가지 규칙을 빼내고 수행 데이터를 통해 사람들에 게 말합니다.

하지만 큰 데이터를 얼굴 뿐만 아니라 데이터의 양을 너무 크면, 데이터 크기, 많은 포함 되어 있기 때문에 사람들 같은 거 대 한 양의 데이터를 처리 하는 것이 불가능 하거나 심지어 되어 처리 하는 방법을 모른다, 다음 컴퓨터를 사용 하 여 자동으로 처리 해야 합니다 법률 데이터 마이닝.

현재, 컴퓨터 수 없습니다 사람들, 복잡 한 논리로 엄격한 하지만 생각, 그래서 그들은 사용할 수 없습니다 우리의 생각 모델 데이터 분석, 사람들 만큼 법, 더 많은 데이터에에서 더 적은 데이터를 분석할 수 있지만 방법은 없습니다, 그래서 우리는 인간이 샘플링 분석을 사용 하는 수 있습니다.

컴퓨터는 단지 반대, 규칙에 따르면 적은 양의 데이터를 분석할 수 없습니다 하지만 장점이 있다, 즉, 작업 속도가 매우 빠르고, 그래서 규칙을 대규모 데이터를 다루는 것이 가능 하다.

컴퓨터는 복잡 한 논리적 생각을 수행할 수 없습니다, 그래서 그것 이므로 간단한 통계, "하드 조사", 무슨 일이, 그리고 그 비슷한 일어나는 때 다시, 그것은 우리에 게 결과의 어떤 종류가 있을 수 있습니다의 통계를 수행 하는 간단한 방법.

큰 데이터의 다른 기능은 큰 데이터 대부분에 대 한 예측, 미래에 일어날 것 이다 말하는입니다. 그냥 과거 동향 및 현상, 미래를 분석 하는 대신 여전히 사람들에 의해 심판을 받을 것 이다.

왜이 간단한 방법은 효과적인가? 이 단어 "빅 데이터", 데이터의 볼륨은 매우 큰 결과 올바른 종종 있기 때문에 다시 갑니다.

우리가 해야 모든이 예제를 알고만 10 번을 던져, 어쩌면 9 번 전면에, 결론에와 서는 확실히 잘못, 하지만 당신이 던져 100000 번, 1 백만 시간 이상, 통계의 결과가 긍정적이 고 부정적인 외관의 확률 50 이어야 합니다. 기본적으로 올바른 긍정적 이거나 부정적인 외관의 확률을 계산 하는 동전을 던져 % 。

네, 큰 데이터 자동 마이닝은이 원리에 기반 하 고 있다.

아니 엄격한 인과 분석, 공저의 결과 대 한 이유의 분석을 통해 하지 하지만 이러한 상황의 통계 지식을 통해 일반적으로 있을 것입니다 이러한 결과, 즉, 현상 및 결과 사이 관계. 그래서 큰 데이터는 놀라운 기능을 염려만 관련성, 원인과 결과, 및 대중적인 용어에 상관 하지 않는다, "만 결과 알고, 왜".

이것은 실제로 사람들이 발견 새로운 데이터 분석, 마이닝 방법, 및 전통적인 방법으로 완전히 다른, 그래서 전통적인 데이터 분석 또는 마이닝 전문가 호출할 수 없습니다 큰 데이터에 대 한 컴퓨터의 장점에 따라 이다.

하지만 조심, 있고 권위 있는 대학에서 유명한 교수를 있을 수 있습니다 전문가로 실행 합니다. 당신은 또한 나타납니다 많은 큰 데이터 책, 커버 없이 예외 큰 "빅 데이터" 세 단어, 하지만 사실 전통, 인공 데이터 분석 방법에는 큰 데이터를 손도 안 서 점을 입력 합니다. 물론,이 없습니다 책 "빅 데이터 시대."

또한, 전통적인 신경 네트워크, 깊은 학습 및 다른 인공 지능, 하지만 또한 기본적으로 큰 데이터, 이것은 여전히 인간 요인, 모델링를 포함 하 여 많은 훈련 프로그램, 사람들이 여전히 필요가 비즈니스 논리 분석은 매우 친숙 한, 현재이 방법에 이므로 실질적인 결과 달성 하기 어렵다. 그리고 큰 데이터 그냥 데이터 통계, 심지어 사람들이 법을 상상할 수 없습니다 찾을 수 많은 수행을 몇 가지 간단 하지만 영리한 알고리즘에 따라 컴퓨터. 큰 데이터는 기본적으로 비즈니스 논리에 무관, 사람들이 어떤 사업, 모바일 인터넷 산업 데이터, 분석 등 그는 업계, 현재 상황의 맥락을 알고 필요 하지 않습니다 알고 필요가 없습니다 및 그것의 미래 동향에, 그는 유일한 필요가 많은 역사적 데이터에 대 한 통계 찾을 수 있습니다.

말하자면, 당신에 게 관심이 되어야 합니다, 그리고 그 큰 데이터를 찾을 수 없습니다?

작은 이야기부터 시작 하자:

80 's에서 두 컴퓨터 괴짜 IBM에서 번역 시스템을 하 고 있었다. 그 당시, 벽돌 집 언어, 문법, 구문 하나님 말 사이의 내부 연결을 탐험 이다. 두 바보는 다른, 그들은 모든 데이터의 문학에 해당 하는 다양 한 언어를 찾을 수, 다른 비판 "이 컴퓨터 폭력 과학", 및 나중에 그들이 멀리 보충 헤 지 펀드 보스. 이제이 두 바보 부흥 기술 공동-ceo는, 상사는 짐 시 몬스.

리바이벌 기술 공동-CEO 각 보다는 연간 소득은 약 100 백만 달러, 연간 소득 월이, 키의 CEO는 두 거의 알려지지 않은. 그들의 두 목 제임스 시 몬스 더 유명한 수학자, 천와 쓴 정리, 첸 양 동료, 이제 은퇴 할 자선 이상의 1 십억 달러의 연간 소득은. 청 천-시 몬스 건물, 양 닝 양 시 몬스 돈을 수리를 이다.

금융 투자의 영역에서 헤 지 펀드는 관련성 및 원인 효과에 초점을 하 고 있다 (부흥 기술, 드 쇼), 잘 하지만 깊은 금융 근거와 가난한 데이터 분석 기능, 회사에 대 한 아무 유사한 성능 및 MIT 금융 앤드류 Lo 솔직히 이해 하지 않는 무슨 르네상스 기술 하 고.

이 봐, 말, 안 쳐다 사람들의 연간 소득 100 백만 달러.

여기서 핵심은 많은 사람들이 "이런이 종류의 컴퓨터 브 루트 포스 과학 아니다" 비판 (이 사람들은 확실히 벽돌 집, 그렇지 않으면 그들은 비판 하는 자격이 되지 않습니다), 금융 과학자 그들은 무엇을 하 고 이해 하지 않습니다.

그게 무슨 뜻인가요? 사람들이 몇 선진국에서이 방법의 승인와 적은 사람들이 알고 그것을 이런식으로, 그래서 당신이 중국에 있는 얼마나 많은 사람들이이 작업을 수행 하는 방법을 알고 상상할 수 있는 방법을 보여줍니다.

중국에서는, 만약 누가 어떤 소득 십억, 언급 하지 않기 위하여 전문가, 교수, 언급 하지 않기 위하여 일의이 비 주류 방법을 사용 하 여 추정 방법의 확률의 많이 굶 어 수를 하지.

어쨌든, 난 사람, 2000 년에 시작 해 서, 그냥 의미 관련성 분석을 위해이 "비 과학적 브 루트 포스 방법"를 사용 하 여 두 미국 바보 같은 번역 시스템에 종사 하는 두 바보와 같은 일을 할 언어와 관련. 그것은 그가이 분야에서 돌파구를 만든 하지만 그가 쓴 문서의 결과 의사, 전문가 읽을 하지 않습니다 말할 수 있습니다. 그는 지금 그것은 작동, 간신히 유지 음식 하 고 설거지에 거의 적합 한 직장을 오래 했다 의류, 공통 할 작은 회사에서 때 보안.

어쩌면 누군가가 물어볼 것입니다, 그림의 언어, 이것은 신뢰할 수 있는? 큰 데이터의 아이디어, 당신은 왜, 두 기술 바보 이미 너희에 게 말한 결과 잊지.

당신은 왜 알고 있다, 당신은 또한 말할 수 있습니다.

사실, 언어는 숫자 보다 훨씬 더 복잡 한 예: 1 및 2, 컴퓨터는 자연스럽 게 어떤 큰, 어떤 작은, 그들의 관계를 알고 얼마나 많은 "사람"과 "큰", 컴퓨터만 어떻게 알고 둘 사이의 관계를 알고 또한 라인, 전통적인 방법은 수동 주석 (라벨의 일부 라는 전문)의 많은 수행 하. 데이터 마이닝 의미와 단어, 심지어 기본적인 동의어 사전 컴퓨터, 아니다의 관련성을 알고 하 고 자체 구축을 통해 컴퓨터 자체를, 그것은 너무 어려운, 그것은 생각할 수 있는, 하지만 남자.

즉, 큰 데이터에서 언어 처리에 비해 숫자, 어려움은 확실히 하지 하나 또는 두 개의 크기 순서 차이, 언어를 할 수 있는, 그래서 수는 매우 간단 하다. 큰 데이터의 경우 큰 데이터입니다 데이터의 어떤 종류에 상관 없이 텍스트와 숫자는 다른 많은 관련성을 찾을.

몇 시간 전, 남자가 우연히 산업 동향 분석에 대 한 질문 결과 데이터를 많이 생성 하는 알고리즘을 같이 한 시간이 걸렸다 하지만 중국에서 아무도 그를 믿을 수 있습니다.

글쎄, 그것은 벗어, 조금 미안 해요입니다. 하지만 당신은 무엇을 알고 지금 진짜 "빅 데이터"입니다. 우선 큰 데이터 예측 하는 데 사용 됩니다, 즉, 직접 당신에 게 미래의 결과, 다른 하나는 단단히 기억 7 단어 "자동 대형 데이터 마이닝", 아무도 당신을 바보 수 다음을 기억 하십시오.

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.