큰 데이터 중 하나는 큰 데이터 분석, 아니라 원인 이상입니다. 하지만이 의사 제안 수 있습니다. 관련 된 관계에서 인과 관계를 유추 하는 방법 큰 데이터의 진짜 문제가입니다. 인과 유추로 알려진 문제 (인과 추론), 애플의 아이폰 6 음성 인식의 기초 이며 구글 자동차 기술을 무인의. 이 분야, 엔지니어링, Uda 진주의 미국 아카데미의 학회 회원의 다니엘 (유대 http://www.aliyun.com/zixun/aggregation/16865.html "> 진주", 일반적으로 국가에서 유대로 번역). 진주) 따라서 2011 튜링 상은 수 상했다. 진주의 친목 제시 확률 및 인과 추론 알고리즘을 인공 지능 규칙 및 논리를 기반으로 처음의 방향을 근본적으로 변경.
, 튜링 문제의 최고 디자인 높이의 아이디어 나 대용량 데이터의 이해를 변경. 진주의 친교의 생각의 깊이, 그것은 실수로 일어났다. 샌 프란 시스 코 역의 "는 마스터의 미국" 9 월 3 일의 오후에는 학회 회원을 정렬합니다. 그것은 단지 예 회의 그 연구 결과의 간략 한 소개를 적어주세요. 하지만 대학인 분명 오해, 그것 전문가 교환 했다 수학 유인물의 64 페이지 준비 생각. 때 그는 미디어, 법률, 경제 및 다른 교양 배경에서에서 관객 도울 수 없어요 하지만 뉴욕 양키스 들었어요. 그는 말했다: "미안, 나 모른다 당신이...". 변경 유인물은 너무 늦게, 쌩, 했다 돼지 앞에 진주를 주조. 보라, 2 시간 후, 하퍼, 대학인의 초기 학습, 억제 수학 생각 밖으로 분출, 그래프 이론, 확률 이론, 비-선형 수식을 캥거루, 10 단계 점프, 황하 물과 같은 하나 이상의 10 단계 보다 더 많은 처럼 우리는 잊지 수집 되지 않습니다. 시간이 왔다, 주최자 반복적으로 메시지가 잘못 된, 한 시간을 했다.
내 옆에 형제, 나 떨고 있으로 깨어 있는 경우 아직도 꿈에서에서 거의 앉아 있다. 나 내놓고 자신, 커피 한잔으로 간신히 청취. 그 후, 하지만 실수로 팬 들에 게 말을 하 고 마지막으로 엑스터시를 들 었. 발견 하는 학회 회원에 대 한 이야기는 질문 때문에 큰 데이터에 생각.
최근 몇 년 동안, 난 상관 관계와 원인 작용에 소개 하는 큰 데이터의 개념에 의해 의아해 왔다. 비록 큰 미국 데이터 이론, Barabasi Academician의 인수, 하지만이 의심 등의 도입 되지 제거 되었습니다. 상관 관계 경험 유도에 해당, 합리적인 공제에 해당 하는 인과 관계. 하지만 큰 데이터만 유도 하 고, 아무 공제 또는 물어, 어떻게 대용량 데이터 유도 및 공제 사이의 변환을 얻을 수 있습니다? 이 생각 병목에 진주의 동료에 의해 해 부 했다.
대학인이, 후 모두를 쳐다보면서 서로 서로이 3.5 시간, 관개는 어떤 dongdong 요구. 학습 경험, 대신 수학 전문가 동료 선형 문제를 해결 하기 위해 비 선형 방법 사용 했다 느꼈다 고 말했다. 통계는 과거에 인과 관계, 거래 관계에 처리 하지 수, 화목의 기여 통계 확률 분석, 인과 관계 반 구조화 된 구조화 되지 않은 것 들을 소개 하는. 찰리, 번역가, 전문 연구 방향와 진주로 같은 필드, Tencent의 큰 데이터 부문 이다. 그가 사용 하는 "사이 ' 청두에는 모델을 사용할 수 있습니다"를 전문적인 관점에서 다시 설명 하는 비유로. 나의 경험을 교환 하는 단계로 추진 상황의 심리적 준비 부족에서 교양 대표로 간주 되었다. 그것은 때까지 그는 그가 들 었 했 고, 확인 하는 것을 연구 했다 비선형 물리학 그리고 그것의 찰스는 아카데미에서 상을와 동일 했다.
내가 말 하는 튜링의 문제의 핵심은 인간과 자연 (기계)의 관계, 인공 지능 둘 다의 단결을 달성 하는 것입니다. 질적, 오늘의 주제에 해당 하는이 질문 (구조화) 및 양적, 유도 및 연 역 적, 감 성과 합리 성-사이의 관계 관계와 인과 관계-문제를 통합 하는 방법. 진주의 academician의 단어, 아테네 (아테네에 바빌론에서 Counterfactuals 협회에서 인과 혁명)의 생각에 바빌론에서 생각의 질문 이다. 큰 데이터 개발 현재 문제는 튜링의 문제의 궤도에서 일탈 하 고 Google의 수학적 알고리즘에 의해 표시 된다, 합리적인 컴퓨팅의 세계를 (인간의 단체의 인식 알고리즘에 따라) 페이스 북 알고리즘을 무시. 통계, 후자는 관련이 관계형 데이터 분석. 후자, 불만족도 했다 고 비판 했다 (효과)에 "항상 데이터의 생각 하지 않습니다, 먼저 모델에 의해 현실 시뮬레이션" 구조화 되지 않은 질적 문제를 구조 하는 의미.
찰리 이전 했다는 대학인 흄의 질문을 제안 했다. 라고, 생각을 인상 하 고 문제를 해결할 사람들의 친교의 Kant, 생각나 고 오늘 말한 순수한 이유의 비판의 수학 버전 이며 생각의 방법 생각나는 뉴턴과 라이프니츠의 생각. 다시 갔을 때 전문적인 자료 상담 집, 나는 그래서 진주의 Academician의 문제 의식의 평가 사람을 발견: "누군가가 언급 철학 (역사)에서 흄 질문: 그것은 제한 된 경험에서 인과 법을 사람에 대 한 가능한?" 이것은 실제로 문제, 마지막으로,는 독일의 철학자 칸트, 영국 경험 파 (흄)와 본토 합리적인 파 (Leibniz-울프) 화해 하 라는 메시지가 표시 하 고 "비판의 순수한 이유"를 썼다. "그것은 마음이 보인다."
칸트의 순수 이성 비판의 원래 문제는 경험과 합리, 상관 관계 및 대용량 데이터에서 인과 관계에의 관계. 라고 같은 문제 해결의 Kant의 아이디어 진주의 동료 처럼 되었다. 칸트는 합리 성 및 커뮤니케이션 경험의 중간 프레임 (프레임)으로 "스키마" 라는 개념을 설정 합니다. "스키마" 경험의 특이성 및 합리 성, 보편성에 의해 특징입니다 하지만 그것은 경험에서 다른 같지 합리. 학회 회원의 "스키마"를 원인이 되는 다이어그램 (인과 관계 다이어그램), 그의 구조상 이론 이다. 이 구조는 완전히 합리적인, 하지만 유연 하 게 조정 될 수 있다. 나는 말 진주와 칸트의 스키마의 친교의 구조 사이의 유일한 차이점은 이전 임시 조정 그래서 그것은 생활, 하지만 기계적인 구조는 구조에 느슨하게 연결 된 조건에 따라 교체 가능한 구성 요소 모듈을 설정 합니다 (예를 들어 라고 찰리, Xi '의 "보편적인 진리" 모델, "구체적인 사례" 성도 들의 교체로) 모듈을 하위, 청두에 사용 될 수 있습니다).
방법, 플라톤의 동굴 우화에서 진주의 회원
원인 및 효과 (진실), 구조 (인간)와 상관 (그림자) 사이의 매핑을 보여 줍니다. 이것은 뉴턴과 라이프니츠의 방법론 같은 말: 열, 수를 경험 하 고 (동굴에 한 사람이 해당) 중간에 구조적된 기능을 설정 하는 제한으로 합리를 사용 하. (관련) 경험 수 무한에 가까운 이유 (원인과 결과), 원인과 결과 (제한 값), 도달 하지 하지만 크거나 원인과 효과로 간주 될 수 있다. 대학인의 고유성은 단순히 기능 하나에 변환 함수 (도식) 구조화 및 비 선형 선형 구조에서 변화를 실현 하. 따라서, 구조적 모델에서 복잡 한 수학 확장의 많은 수의 그의 이론 초점 되고있다. 그의 모델 이라고 "그래프 모델" 또는 "베이즈 네트워크" (베이지안 네트워크), 변수 공동 배포 또는 데이터 생성의 메커니즘에 설명 합니다. 관객 자는 때 그는이 부품의 특정 내용에 대 한 이야기는. 인과 구조의 그의 이론에 관해서는 난 개인적으로 주장 내 강의에 "고무 막에 위상 기하학", 라는이 매니폴드 미적분학 (다 기관에 미적분학)는 또한 유효 하다.
현재, 사람들에서
토론 대용량 데이터에 나쁜 경향이 있다 좋은 기초, 소위 구조화 되지 않은 데이터의 일방적인 추구 구조 아직 재생 하지는. 이 방법으로 "오래 된 데이터를 생각", 차동의 솔루션은 어떤 대학인에 의해 강평 되었다, 함수 표시 되지 않으면, 그래서 우리가 직접 시퀀스에서에서 극한을 찾고 싶어요. 중국에서는, 이것은 특히 심각한입니다. 이 테이블은 선 큰 데이터를 만들 것입니다. 비즈니스, 큰 데이터, 연락처, 하지만 장 공급 업체에 대 한 더 적합의 판매의 모피를 결국 찾을 수의 실용적인 사용을 배제 하지, 왜, 하지, 오래.
그러나 이것은 놀라운, 전체 통계 및 확률 이론, 아직도이 수준에서 "상관" 이론과 "인과 관계" 이론에 대부분은 매우 드문. 칼 피어슨 원인에 대 한 통계 연구에 분명이 수수께끼 통계 (심슨 역설, 성탄절-심슨의 역설)의 근본적인 문제는 큰 데이터를 재앙 근본적인 문제 이기도 합니다.
, 전체 논리, 유도 적인 이론에에서만 것 들 사이의 관계를 표현할 수 있다 그리고 진짜 인과 관계를 가리킬 수 없습니다. 이것은 인간의 되었습니다 문제입니다. 바빌로니아 1000 년 전에 피타고라스, 피타고라스의 정리의 응용 프로그램을 마스터 했다 이미 천체 관측을 시작 했다 하지만 아테네 경험에서 천문학의 투기 이론 증 류 했다. 우리는 여전히 큰 숫자에서 바빌로니아입니다.
, 인과 유추 너무 잔인 함. 관계 구축 완전히 하는 경우 또한 있다 문제, 인간의 자유의 지의 공간을 제외 합니다. 그 동료 보어 Godel 역설에 대해 아직 생각 하지는 것 같다. Chiong 의견 보어의 동료로: "알 수 없는, 알 수 있어야 합니다 나, 나가." 그들은 문제를 해결 합니다. 확실성 및 불확실성의 그룹입니다. 순간에, 방법은 실현; "
생각는 대학인의 또한 정말 쉽게, 큰 데이터 재단에 대 한 인간의 수 십년 앞서 "꿩" 대학에서 졸업 하지만 몇 사람들이 그를 이해. 그의 아들 다니엘 진주, 월스트리트 저널에 대 한 외국 특 파 원 9-11 후 파키스탄에서 테러 집단에 의해 체포 되었고 며칠 후 참 수 있습니다. 대학인 질문에 대답 하지 않았다 간, 그리고 그의 아내를 동반 했다. 뉴스 두 번째 미국 기자는 그의 아들, 같은 테러 집단에 의해 참 수 되어 했다 아침에 온 그의 아내는 기억 한다 그녀의 아들 다시 하기 때문에.