큰 데이터의 손에 우리의 미래 것인가?
만큼 우리가 이해할 수 없는 것 들이 발생, 우리 그것은 실수로, 그것은 겉보기 실수로 이렇게 역사의 진화와 굴곡에 기여한 것 들의 주사위 처럼 될 것 같다 말할 것 이다. 하지만이 기회를 실제로 무슨 뜻?
그리고 프랑스의 수학자 푸아송 포인트는 일단 우리는 인간의 행동은 가장 임의의 인정, 그것은 수 있다 갑자기 예측할 수 있습니다.
역설? 사실, 가장 적절 한 예 중의 하나는 주사위: 점의 수 때마다, 예측 하지 수 있지만 전반적인 법률을 따를 수 있습니다. 즉, 약 5 ~ 7 롤 당 번 나타납니다 일단 6, 그리고 던져 100 번 6의 확률은 거의 제로.
푸아송의 이론 확률 이론, 더 분명히 하는 "발생"에서 유명한 물리학자 Barabasi 동안 "인간 행동 93%는 예측 가능한" 유명한 포아송 분포입니다.
글쎄, 우리의 전화 기록과 행방 캐리어의 저장에는 때 우리의 이메일 서비스 공급자의 로그; 맛과 지불 신용 카드 기록에는 우리가 무엇을 구매; microblog, 공간, 및 개인 홈페이지의 모두는 단순히 웹사이트에 표시...
이 레코드의 존재 개인 프라이버시 위기 폭발 했다 하지만 그것은 또한 만들었습니다 전례 없는 역사적 기회-그것 수만 수천의 사람들이, 보다는 오히려 편견 없이 몇의 행동의 상세한 기록을 제공 했다 처음으로. 이러한 데이터와 강력한 컴퓨팅 기술, 물리 학자, 심리학자 및 경제 문제 중 일부를 신중 하 게 공부를 수 있다. 그들은 충분 한 증거가 있다 인간 행동의 대부분은 규칙, 주제 그리고 그들의 재현성 및 예측 물리 과학의 비교.
결과 단지 과학자, 하지만 일부 이러한 모델 및 원칙, 수백만 달러의 가치가 있으며 비즈니스 모델으로 인간의 행동을 추적, 구글 및 야 후, 같은 회사는 비싼. 그것은 그들은 우주를 반대 라고 할 수 있습니다. 과거에는, 인간 행동 및 아이디어를 이해 하려면 심리학자 인증서에가 야 하지만 지금, 당신은 먼저 컴퓨터 과학 학위를 받이 필요가 있습니다.
확장 하 여, "상관, 재료, 10 년, 총의 연속 컬렉션 학자를 될 수 있는 경우", 매일 것 들이 "발발"의 기초가 될 것 이다 즉, 시간이 우리의 가장 귀중 하 고 대체할 수 없는 소스 이며 우리는 그것을 존중, 우리 중요 하지 않은 것 들, 그리고만 우선 순위 목록, 전원 법 및 분화를 필연적으로 발생 하지 제거 해야 합니다.
마찬가지로, "역사 자체를 반복 하지 것입니다 하지만 그것은 그것의 자신의 리듬", 만약 당신이 수 분별 법, 그리고 우리의 미래, 아마도 큰 데이터의 손에.
"분화" 저자 알 버트 Laslo Barabasi (알 버트-lászlóbarabási)
이 글의 후반부는 책 추천, Zhan 루에서 추출 물 "분화-빅 데이터 시대 가능할 미래 새로운 생각" 문화, 저자는 글로벌 복잡 한 네트워크 연구 기관, 폰 노이만 수 상자 알 버트 Laslo Barabasi.
저자는 일반 독자, 통신 전문가 왕 Yuquan Weibo에도 마케팅에 대해 잘 알고 하지 않을 수 있습니다: Gladwell의 "티핑 포인트" 슈퍼 베스트 셀러가 되었다 모두가 이해할 수 있는, 케빈 켈리 "가 출" 대부분 사람들이 이해 하지 않는, 하지만 모두 고전 이다; Barabasi은 정말 복잡 한 네트워크, 그 링크를 이해 하는 전문가 동일한 시스템 및 그랜드, 하지만 아무 명성, 이유는? 일부 네티즌 인터넷 시대의 패스트 푸드 문화 해석, Barabasi의 쓰기 기능 때문에 다른 사람 생각: 많은 수의 예제, 심지어 소설 처럼, 결론 요약 될 필요가.
책의 주요 포인트는 포함 하는 책의 내용으로, 위에 나열 된:
포아송의 역설
푸아송은 인간의 행동은 가장 임의의 인정 하 고, 일단 그것은 갑자기 예언 될 수 있다 지적 한다.
이 역설 될 것: 예측 비상을 의미 하는 경우 어떻게 예측할 수 있는 우발 그것? 대답은 간단 하다: 푸아송의 소위 예측은 우리가 우리의 일상 생활에서 추구 다릅니다. 교황의 십자군의 미래의 이스트 Telegdi의 예측, 달리 그의 방식은 원자 운동의 아인슈타인의 이론에 가깝다. 아인슈타인의 단일 원자 대신 원자의 모션은 무작위, 릴리스 포인트에서 거리는 확산 이론에 따라 추론 했다 그래서 궤적에 대 한 추측은 불가능 했다 알고 있었다.
마찬가지로, 포아송 여부는 배 심원 옳은 결정 했지만 그 모든 배 심원 투표는 주사위 처럼 생각에 대해 생각 하지 않았다: 그들은 바로 대부분의 시간, 하지만 때때로 그들은 실수를, 그리고 우리가 결코 알고 그들이 옳 았 때 그들은 잘못 됐다. 이 가설의 전제에 포아송 신념 레이트의 통계 데이터를 사용 하 여 전체 배 심원 제도의 신뢰성을 파생.
다음 토스 미스 테리 이지만,이 딴 마법의 규칙의 일종이 이다. 명백한 규칙에도 불구 하 고 포아송 과정은 실제로 우연한 과정, 그것은 실수로 이벤트의 일련의 축적. 따라서, 푸아송의 예측에서 편차는 종종 공개 깊은 패턴 또는 모델을 찾을 수 숨겨진된 순서를 나타냅니다.
그것은 사실 우리가 관찰 하는 현상의 많은 절대로 사고, 행성 운동, 변하지 않는 등 낮과 밤. 하지만, 날씨 등 다른 현상, 순전히 실수로 보인다. 그러나, 리처드슨, 지적 분위기 법률 및 방정식의 시리즈는. 이제, 세계 각국에서 기상 성공적으로 계산 하 여 날씨를 예측할 수 있습니다. 이전, 일식, 홍수, 가뭄, 등 많은 현상, 신비한 창조 자에 의해 지배를 생각 했다. 하지만 지금은 이러한 현상이 인류에 의해 예언 될 수 있다. 이 몇 가지 기본적인 법률 인 간에 의해 발견 남아 의미 일반적으로 임의성에서 벗어난 다는 것을 우리에 게 알려줍니다.
빅 데이터 시대에 큰 기회
우리는 끊임없이 변화 하지만 점점 정교한 상태 모니터링 되 고 있습니다. 사실, 우리가 지금 모든 데이터베이스에서 단서를 찾을 수 있습니다.
이메일이 이메일 공급 업체의 로그 파일에 저장 됩니다; 우리의 통화 기록 시간 스탬프 백업 전화 회사의 대용량 하드 드라이브에 태그로 우리의 환경 설정, 취향 및 지불 능력 신용 카드 보관 했다 때 그리고 우리가 뭔가 구입, 공급자, 모든 우리의 개인적인 페이지 공간, 페이 스 북, 파일과 블로그 정보는 여러 서버에 보관, 우리의 즉각적인 행방은 완전히 우리의 휴대 전화 업체의 손에; 우리의 외모와 드레스 캡처하고 주요 쇼핑몰에서 카메라에 의해 기록 된. 비록 우리가 일반적으로 하지 않기로 생각, 우리의 생활은 사실에 데이터베이스 생겨나고 기록한 정보.
거기에 의심의 여지가 이러한 레코드의 존재 개인 프라이버시 위기 폭발 했다 고 문제의 심각성을 과장 수 없습니다입니다. 그러나, 그것은 또한 역사적인 기회는 처음으로 그것은 수천의 사람들이, 보다는 오히려 편견 없이 행동의 몇 가지 자세한 기록으로 우리를 제공 만듭니다. 지난 몇 년 동안, 이러한 데이터베이스 주요 실험실, 많은 컴퓨터 과학자, 물리학자, 수학자, 사회학자, 심리학자, 및 경제 연구 새로운 기술과 강력한 컴퓨터의 지원으로 특정 문제를 수 있도록도 왔다.
실험의 결과 흥미 진 진한 했다입니다. 그들은 가장 인간 행동, 모델, 법과 원칙에 의해 규율 됩니다 및 그들의 재현성 및 예측 자연과학의 비교는 충분 한 증거가 있다. 결과 단지 과학자, 하지만 일부 이러한 모델 및 원칙, 수백만 달러의 가치가 있으며 비즈니스 모델으로 인간의 행동을 추적, 구글 및 야 후, 같은 회사는 비싼. 그것은 그들은 우주를 반대 라고 할 수 있습니다. 과거에는, 인간 행동 및 아이디어를 이해 하려면 심리학자 인증서에가 야 하지만 지금, 당신은 먼저 컴퓨터 과학 학위를 받이 필요가 있습니다.
발발, 생명의 기적의 필수 요소
인생은 부드러운 멀리 또는 무작위, 오히려, 질병, 진화의 년의 수백만 수천에서의 몇 년에서 인간 활동의 주 분에서 세포 활동의 시간 밀리초에서 항상-버스트 있다. 폭발성 유형 적응과 생존에 대 한 생물 투쟁 보여주는 삶의 기적의 필수적인 요소입니다.
미국에서 65 살 이상 사람 병원 또는 병원, 그는 또는 그녀는 그들의 방문의 세부 레코드를 제출 하는 데 필요한, 때마다 시간, 장소 및 진단, 건강 보험 제도를 포함. Nicolas Kristaski의 도움으로, 우리 팀 10 년 기록 있고 2 백만 환자의 의사를 볼 시간을 표현 하는.
우리는 질병, 다이어트, 운동, 흡연과 음주 습관, 환경과 우리의 작업의 성격에 우리의 유전학에서 많은 요인에 따라 달라 집니다. 그래서 무작위와 예측할 수 없는 질병의 일 이어야 한다.
당신이 동의 모든 인간의 행동은 무작위 하지만 폭발 경우 의료 역사에 우리의 발견이 놀라운 있을 수 있습니다. 그러나 우리는 공포를 걸릴 거 야. 알다시피, 질병의 긴급 확실히 우선 순위 목록에 기반 하지 않은. 우리가 질병을 우리가 바라는 대로 우선 순위를 줄 수 있는, 모두 직접 할 일 목록의 하단에 넣어 것입니다 확신 합니다. 질병에 대 한 낮은 우선 순위를 설정 하 여 우리는 우리가 결코 아프게 되며 건강 한 생활을 보장할 수 있습니다. 슬프게도,이 "공격", 우리 경우는 질병 이며 우리는 놀라운 우리의 피해자를 걸릴 것입니다.
일반적으로, 실용적인 응용 프로그램으로 기본적인 과학 갈 길이 필요 합니다. 20 세기 양자 역학의 과학적 기적 하지 교착 상태를 끊기 위하여 트랜지스터의 발명까지, 거의 반 세기에 어떤 실질적인 역할을 담당해 왔습니다. 마찬가지로, 비록 의료 혁명, 모든 약물 사용할 수 시장에서 10 년 후 발생은 인간 게놈의 해독 게놈 발견 하기 전에 사용 하는 시행 착오 방법으로 개발 되었습니다.
이 기초에, 나는 분화 이동 했다 이렇게 빨리 기초 과학에서 실용적인 응용 프로그램을 보고 놀 랐 다. 사실, 박사 학위 없는 경우에이의 잠재적인 영향을 이해할 수 있습니다. 말도 없이 다른 것, 그들은 적어도 우울증 진단의 간단 하 고 그대로 방법을 촉진 했다. 당신이 우울 하 고 모든 증상 보여 잠재적인 감정 장애? 그런 다음 귀하의 움직임을 추적 하는 시계에 놓고 의사 진단 임박한 우울증의 제거 하는 데 도움이 당신을 줄 것 이다.
보편적으로 적용 가능한 폭발 유형
더 밖으로 보면, 우리의 신체 세포는 문제, 경향이 더 우리가 우리가 종종 건강을 유지할 수 있는 기적 이다 느낀다. 하지만 그것은 훨씬 덜 가능성이 두 단백질의 뉴욕에서 당신의 가장 친한 친구와 함께 멋진 만남 보다 서로 찾을 것입니다 그리고 당신은 왜 우리의 유전자는 그래서 성공 했습니다 궁금 수 있습니다.
당신은 그것을 알아낼 수 없습니다 유일한 사람이 아니에요. 생물학자는 항상 많은 유전자, 단백질, 대사 산물, 및 조직을 구성 하는 RNA 분자를 조정 하는 셀의 기능에 깜짝 놀라게 되었습니다. 주로 그것은 세포의 내 면 세계의 영웅을 보기 위해 정말 열심히 하기 때문에 알고는 프로세스에 대해 거의.
또 다른 완전히 다른 시대에서 필드, 다윈 추측 각 새로운 종족의 출현은 점진적인 과정, 그리고 기존 종족의 다른 자손의 수는 긴 과정을 겪어야 했다. 하지만이 지속적인 변화의 증거만 되지 않은 드문, 지금도, 다윈 "내 이론에 가장 유리한 토르" 라는.
사실, 전에 년의 수백만의 화석 작은 진화 변화를 보였다. 대략 모든 수만 년의 진화의 순간에 거의 새로운 종족 이다. 진화는 세대의 화석에 기록 된 역사의 버스트가 있다. 동시에 이러한 발견 어려운 퍼즐의 일련으로 이어질. 우선, 그렇지 않으면 결정 또는 버스트, 생성 하는 우선 순위 설정은 다음 왜 분화에에서 나타나지 매우 많은 시스템? 우리는이 보편성을 설명할 수 있습니까?
최근, 시스템 생물학은 인간 세포에서 분화 포인트를 잡으려고 유전자 활동 모델을 개발 했습니다.
지식 또한 폭발, 그리고 영감의 불꽃이 수세기 모르는 혼돈을 밝히는 수 있습니다. 일단 우리가 솔루션을 찾을 수 있습니다 우리가 모든 문제를 해결 또는 그냥 더 많은 문제가 발생? 생각이 나 과학에 큰 변화 중 많은 사람들이 투 옥 보다 더 많은 깨달음을가지고 있기 때문에이 두 질문 모순 되지 않습니다.
(책임 편집자: 류 펜)