키워드:우리 우리 통찰력 우리 통찰력 빅 데이터 우리 통찰력 빅 데이터 if 우리 통찰력 큰 데이터를 많은 경우
Gurjeet Singht, 공동 설립자 이자 ceo 인 AYASDI의 말한다는 쿼리에서 데이터 분석 자체에 죽은 끝 이며 현재 http://www.aliyun.com/zixun/aggregation/14294.html을 가리키는 " >의 빅 데이터만 긴 3 월의 첫 번째 단계를 완료.
많은 사람들이 그들은 연구자만 분석 하는 데이터의 1%에서 수집 된 데이터에서 통찰력을 추출 알고 충격을 받을 것 이다. 분석 중인 데이터의 그 1% 지배 혁신 및 통찰력, 그리고 지금 우리가 "큰 데이터." 전화 매일 수집한 데이터의 1 quintillion (百万3次) 바이트의 데이터의 99%는 완전히 악용 하지.
우리 모두 알고 큰 데이터의 사용은 매우 유망 하지만 현재의 여러 가지 요인에 따라, 데이터의 효과적인 사용은 여전히 병목. 약물 연구 및 개발 과정에서 데이터 화학 공정, 새로운 에너지 탐사, 지질, 테러리스트 추적, 예방 사기 보다 더 많은 데이터를 사용 하 여 보다 더 많은 동일한 방식으로 사용.
이제 우리는 이러한 문제와 다른 글로벌 데이터 사용 병목 현상의 결과 실현 하기 위해 왔습니다. 이 많은 수에 있는 거 대 한 투자를 산란 했다 및 데이터 작업 또한 뜨거운 작업 데이터 과학자, 그리고 개인 데이터 분석 서비스 제공 업체의 거래액 $ 밀어 왔다 수십억 조. 그러나, 분석 데이터를 1%에서 100%를 올리기의 장래성을 상상할 수 있습니까?
기존 데이터 분석에 대 한 통찰력
어떻게 시작 합니까 인간 게놈 처럼 큰 데이터 집합에 있는 경우? 예를 들어 오바마는 최근 인간 두뇌의 매핑을 주 창? 휴식을 통해, 우리는 세계에서 가장 복잡 한 문제를 해결 하기 위해 필요 하 고 우리가 데이터에서 지식을 습득 하는 방법을 근본적으로 변경 해야. 우리가 여기에 대해 생각 할 첫 번째 것은:
막다른 이어야 쿼리에서 시작: 쿼리 자체는 문제가 아니다. 사실, 당신은 어떤 질문을 알고, 일단 쿼리는 중요 합니다. 이것은 또한 키: 쿼리의 원래 의도에서 많은 양의 데이터, 포인터를 찾으려고 하지만 그들은 하지 않았다.
데이터 비용: 대부분의 데이터가 저장 이상 비싸요. 그리고 Hadoop 또는 redshift 같은 도구를 사용 하 여 매우 비용 효율적인 된다 심지어 많은 양의 데이터 쿼리. 물론, 이것은 보기의 하드웨어 지점에서 만입니다.
의견은 돈: 우리는 그것에 대해 지불 하고자 하는 유일한 이유는 데이터에서 통찰력 값을 해제할 수 있습니다. 불행히도, 우리는 수집 된 데이터의 값의 대부분을 잃었습니다. 데이터 수집의 비용 수 있지만 높은, 비용 효과 분석의 명확 하 게 높은 수준 이다. 데이터에서 직접 추출 하는 통찰력을 사용할 수 있는 도구, 우리 가정을, 매우 지능적인 사람에 의존 하 고 우리의 도구를 사용 하 여 유효성을 검사 (또는 부정) 이러한 추측. 때문에 추측에 의존,이 통로에 자연 결함이 있다.
당신은 이미 충분 한 데이터: 지속적인 믿음을 "만약 우리가 충분 한 데이터, 우리가 얻을 것 이다 확실히 우리가 원하는." "새로운 데이터 수집에 너무 많은 시간과 에너지 낭비 하 고 당신이 실제로 더 많은 할 수 있는 당신의 손에 데이터." 예를 들어 AYASDI의 최근 통찰력 과학적 보고서, 12-올해-옛 유 방 암 환자, 10 년 이상에 대 한 분석 되었습니다 했습니다.
큰 데이터는 그냥 시작 하지 끝.
우리는 종종 획기적인 암 연구, 에너지 탐험, 약물 발견 및 금융 사기 탐지, 그리고 어떻게 그것은 범죄에서 다른 경우 "데이터를 큰 거품"의 대 이유의 다양 한 데이터 분석에 실패 하는 사람들에 대해 들었어요?
그래서 우리는 데이터 분석에 게 높은 기대를 줄 필요가, 우리 차세대 솔루션을 충족 해야 합니다 깨닫게 필요가:
권한 부여의 분야에서 전문가: 데이터 과학자의 주파수는 기업의 요구에 뒤에 완전히 되었습니다. 이 개발 도구 (데이터 과학자) 그들을 위해, 대신,를 계속 중지 할 수 있습니다 비즈니스 사용자 (생물학, 지질학, 보안 분석가 등)에 대 한 해당 도구를 개발. 그들은 다른 사람 보다 더 많은 문제의 상황을 이해 하지만 최신 기술 이나 수학 따라갈 수 없습니다.
가속 탐사: 우리가 빨리 중요 한 통찰력을 얻이 필요가. 그것은 큰 데이터 기술은 약속은 최대한 빨리 밖으로 변합니다. 만약 우리가 이런 방식이으로 개발을 계속, 우리가 모든 데이터에 대 한 모든 질문을 올릴 수 없을 것 이다 때문에 키 통찰력, 빠른의 속도 결코 얻을 수 있습니다 우리.
인간-기계 통합: 통찰력을 더 빨리 얻이 필요가 기계 지능에 더 많은 투자. 우리는 기계 연결 및 비즈니스 사용자에 게 그들의 통찰력을 탐구 하는 더 나은 출발점을 제공 하는 데이터 요소 간의 관계를 찾는 대 한 더 많은 책임을 해야 합니다. 사실, 그것은 전적으로 가능한 알고리즘 접근을 통해 이러한 문제를 해결 하 고 큰 데이터 집합의 현저한 특징을 발견 하는 사람들은 결코. 최근 연구에서 예를 들어 검색 알고리즘으로 웹 검색 엔진 로그 발견 했다 이전 보고 되지 않은 약물 부작용.
다양 한 형태의 데이터 분석: 연구원 데이터 및 구조화 되지 않은 데이터를 분석 해야 하는 물론. 또한, 우리는 구조화 되지 않은 데이터의 다양성을 인식 해야: 모든 언어, 소리, 비디오, 그리고 얼굴 인식 문서.
그것은 큰 데이터 진화에 관해서 라면, 우리가 초기 단계에 만입니다. 분명히 우리가 1% 데이터의 분석을 계속 경우 우리만 1% 값을 활용할 수 있습니다. 우리가 다른 99%를 분석할 수 있습니다, 우리가 다양 한 방법으로 세계를 앞으로 밀 수 있다 생각해 보십시오.
이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이
페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.
커뮤니티에서 표절 사례를 발견한 경우
info-contact@alibabacloud.com
으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.