어제와 오늘 나 오하이오 주립 대학의 큰 데이터 미래 심포지엄에 참석. 오하이오 필드에 중요 한 학문적 인 힘을 되 고 지상에, 큰 데이터 센터를 만들에 IBM과 일하고 있다. 심포지엄 전국에서 전문가 전문가 영국에서 현재 성과, 동향 및 분야에서 주제에 대 한 유익한 토론을 함께 가져. 그것은 유감이 오후의 전시회를 참석 하지 않았다 하지만 회의의 웹사이트와 정보 사회 (ajournaloflawandpolicyfortheinformationsociety)의 정책 및 법률 저널의 이번 간행물에 그것에 대해 더 배울 수 있습니다.
큰 데이터 및 개방형 데이터 같은 것은, 되지 않습니다 하지만 그들은 닫힌 연결 (내가 말했듯이 주제에 "얼마나 열릴 것 이다 미래의 큰 데이터?"). ). 우리가 보고 있는 큰 데이터의 일부는 또한 데이터 열 관련이 있습니다. 이런이 맥락에서 난 콜럼버스에 큰 데이터에 대 한 배운 9 가지와 함께 했다. 세미나의 공식 웹사이트에서 나 굵게 사람의 이름을 볼 수 있습니다.
대용량 데이터에 대 한 과감 한 응답에 대 한 준비. 많은 스피커 "큰 데이터과 대 광고"의 주제 이라고는 큰 데이터는 너무 열정적으로 우리가 지금 반응 루프에 들어갈 수 논의 되 고는 생각 합니다. Mikenelson는 "쓰레기 데이터" 그는 공공 장소에서 보았고 심지어 우리가 "빅 브라 더"-할 수 있는 큰 숫자 이름을 변경 해야 합니다 제안 처럼 많은 사람들이. 그 이름을 제안 했다: Bffmudd, 큰 (큰), 지방 (fat)에 대 한 약어 무질서 (고속), 빠른 (지저분한), 구조화 되지 않은 (구조화) 분산 데이터 (Distributeddata).
"빅 데이터 거 만"의 인식. 여러 명의 스피커는 "Google 독감 트렌드"-첫 번째 큰 예제 중 하나 큰 데이터 예측 값-매우 정확한 것으로 판명의 보여주는 새로운 보고서 인용. 명확 하 게, Google의 알고리즘을 팅 겨 보고 잘못 된 방법으로 똑 똑 수 있습니다. 어떤 실수, 그것은 그를 광범위 한 그림을 봐 하지 않습니다 그냥 데이터를 분쇄 하 여 진실을 찾으려고, 당신은 일반적으로 하지 않습니다 원하는 결과 얻을 하는 레슨 이다.
데이터가 판단에 대 한 대체 되지 않습니다. 데이터, 특히 큰 데이터는 사람들을 도울 수 있는 도구 결정, 하지만 그들은 대용품으로 행동 하지 않습니다. Rayharishankar 말했다: "데이터 및 분석은 정보, 정보와 컨텍스트 통찰력을 제공할 수 있습니다, 통찰력 옳은 액션을 인도 할 수 있을 것입니다, 오른쪽 액션 승천의 값의 결과 대해 있다."
상관 관계는 이론 보다 더 강한 수 없습니다. 큰 데이터 지지자 중 일부는 큰 데이터 거의 게 이론 중복 주장 한다: 그들은 이유를 설명할 수 없는 이론 경우에 충분 한 데이터를 우리가 찾을 수 있는 많은 중요 하 고 유용한 패턴 및 동향, 말. 실제로, 간단한 상관 관계 어느 정도 드라이브 정확한 예측 수 있습니다. 그러나 예측 하는 기능으로도 정말 공부 하는 시스템을 실행 하는 방법을 이해할 수 있습니다 의미 하지는 않습니다. Eytanadar는 우리가 큰 데이터 범위의 모든 관련 노력에서에서 보면 예측 해석, 그리고 그냥 미래를 예측할 수 있는 패턴에 초점을 맞추고 보다는 우리가 무엇을 보고 이해에 더 많은 초점을 제안 합니다.
큰 데이터는-위험-추적 "모바일" 사회. 세계적인 규모로 모바일 장치 인 간에 대 한 기본 온라인 연결 도구 되고있다. Farnamjahanian 지적을 2015 년까지 전세계 모바일 장치의 수 인구의 두 번 시간, 모든 장치 데이터를 수집할 수 있는 회사를 위치 정보 및 기타 데이터를 보낼 수 있습니다. 이 미래 사회 데이터의 주요 소스 중 하나 될 것입니다. Katecrawford 하지만? 여기 개인 정보 보호 위험을 지적: 인간의 이동성 패턴의 특수성 때문에 3-4의 휴대 전화에 의해 생성 된 데이터 요소를 사용 하 여 사람을 확인할 수 있습니다.
큰 데이터 도울 수 있다-또는 손상 시의 민주주의 기관. Harveymiller 말했다, 모바일 데이터를 통해 도시 활동을 추적 하는 기능으로 원격 환경 센서, 레이저 생성 항공 지도, 그리고 더 많은 도구 수 우리에 게 더 높은 신진 대사 기능을 가진 슈퍼 조정된 시. (불행히도, 도시 분석에 Michaelbatty의 기조 연설 전에 떠나야 했다 하지만 그는 그의 개인 웹사이트에 연설을 제공) Katecrawford 다시 경고 하지만. 만약 우리가 주의 도시 데이터 컬렉션 비대칭 부자 고 가난한 사람들을 다치게 하 될 것입니다. 보스턴의 Streetbumpapp 애플 리 케이 션, 예를 들어 스마트폰, 도로의 울퉁불퉁한 혹을 반영 하기 위해 자원 데이터를 사용 하 여 스윙 상태를 추적 하 여 수구에서 데이터를 수집 합니다. 하지만 대부분 스마트폰 소유자 풍요로운에 속하는 사람 처음 풍부한 지역에서 모니터와 수리 수구-문제 streetbump는 현재 수정에 노력. 반대 측에 "예측 모니터링" 사용 되 고 높은 범죄율 예상 되는 지역에서 경찰 통제 적용 차별 적용을 선도.
개인 정보 보호는 여전히 중요 하다. 보고서 공개, 특히 젊은 사람, 그들의 개인 정보 보호를 버리고 잊어 라. 우리는 여전히 개인 정보 보호, 걱정 하지만 우리가 무엇을 해야할지 하지 않습니다. 여기에 고려해 야 할 두 가지: 우리 정부 기관 정보를 알고 싶어요 또는 데이터 추적 회사 소개, 수집 그리고 만약 우리가 그것을 좋아하지 않아, 우리가 수집을 중지 그들. 이러한 고려 사항을 해결 하는 방법 명확 하지 않다. 회의에서 일부 스피커 제안 간단한 해결책: 정부와 기업 데이터에 대 한 보다 투명 하 게 하 그들은 했다 수집, 어떤 사람들 "상호 인정" 전화 뭔가. 하지만 장기 투명도 옹호, garybass, 제안 된 솔루션 "아니다 현실 세계." 지난 30 년 동안 데이터를 사용할 수를 얻으려면 싸 워 왔어 하 고 정부 및 기업 데이터를 액세스할 수 있도록 필사적으로 애쓰고... 이것은 장기화 투쟁 이다. 여기, 위험 다른 사람 말은 우리가 데이터 수집 및 수집가 사이 힘의 비대칭을 향상 시킬 수 있습니다.
큰 데이터는 데이터의 아름다움을 표시 합니다. 데이터 시각화에 급속 한 발전 멋진 결과 만들 수 있습니다. 예를 들어 봐이 "경험 자전거 군중" 비디오, 점차적으로 런던 자전거 트래픽 데이터를 분석, 깨끗 한 모델과 부분적으로 완료 된 시각화 오하이오 슈퍼 컴퓨터 센터를 표시. 이러한 데이터 시각화 미학에 대해, 그것은 이해에 대해. Angelashen-셰, IBM, 인간 두뇌의 메시징 여행 컴퓨터 화면에서 데이터 "인간의 소비에 대 한 더 많은 적합"와 "마지막 18 인치"에 초점을 필요에 대 한 얘기에서 데이터 시각화 전문가
큰 데이터 (대부분) 큰 가치를 생산할 예정 이다. 모든 경고, 이외에도 악용 될 수 있는 큰 데이터에 많은 사회 및 경제 가치 있다. 맥킨 지, 몇 년 전, 랜드마크 큰 데이터 보고서 예측 그것의 수십억 달러의 수조의 경제적 가치에 놀 리 려는 것 이다. Angelabyers, 연구의 공동 저자 말했다 오늘 그것은 또 다른 5-10 년 우리가 여전히 얼굴 때문에 부분에서이 값을 생성 하는 중요 한 기술 격차를 아직도 걸릴 수 있습니다: 사용할 수 있는 데이터의 수와 할 수 있는 사람의 수 사이의 격차는 데이터의 사용. 하지만 경제 값은 신흥 고 몇 가지 놀라운 방법으로. Johanbollen와 그의 팀 큰 데이터 감정 분석에 사용 트위터 주식 시장 예측: 트위터의 "진정" 분위기 예측 다우 존스의 닫는 점이 3 일 후에 계산.