큰 데이터 과학자 소리 "이동 벽돌" 직장에서 좋은.

출처: 인터넷
작성자: 사용자
키워드: 이러한 데이터 과학자 큰 데이터 과학자 큰 데이터

  

(뉴욕 타임즈, 타이거 킁 킁 인턴 웨이 Cen 컴파일된에서 원본)

인기 있는 단어 "빅 데이터" 다양 한 디지털 데이터, 네트워크, 이동 전화 및 컴퓨터에 센서를 포함합니다. 지능형 소프트웨어를 사용 하 여이 데이터를 발굴, 발견을 많이 얻을 수 있습니다. 그것은 가능 하 게 데이터 기반 의사 결정 과정에 다양 한 분야. 이 때문에 데이터 과학자 인기 채용 되고있다. 하지만 일반적으로 어떤 데이터 과학자를 아십니까?

데이터 구성

사실, 데이터 과학자 발굴, "데이터 마이닝"로 알려진에 대 한 사용할 수 있습니다 때까지 무질서 데이터 정렬에서 그들의 벨 시간을 할애. 이러한 미세 하 고 지루한 작업 상상 하기 쉽지 않다. 이것은 우리가 큰 데이터, 데이터를 수집 하 고 사용할 수 있는, 그리고 간척의 일종 필요의 현대 광 야 가운데 있기 때문에.

티모시 위 버, 막을 식품 회사의 CIO는 "빙산 효과" 포인트 (빙산) 큰 데이터 "데이터 잡음"에. 사람들이 단지 결과 볼, 하지만 많은 양의 노동 뒤에 결과가 표시 되지.

그러나, 그것은 또한 기회와 공생의 질문입니다. 일부 신생 자동으로 수집, 정리, 및 데이터를 관리 하는 소프트웨어를 개발 하 여 큰 데이터의 병목을 깰 하려고 합니다.

미래에 점점 더 많은 데이터 소스는 회사의 운영을 가능할 것 이다. 식품 산업에서 예, 사용할 수 있는 데이터는 출력, 근원 및 교통, 날씨, 소매 데이터 및 소셜 네트워크 리뷰입니다. 우리가 무엇을 측정 하는 것은 감정의 변화 수요의 신호입니다. 결과적으로, 우리가 어느 때 보 다도 더 명확 하 게 작업의 모든 단계를 볼 수 있고 우리가 우리의 생산 계획 및 재고에 맞게 시작할 수 있습니다.

그러나, 데이터의 다른 종류를 조립 하는 과정에서 문제가 발생할 수 있습니다. 센서, 파일, 네트워크, 및 전통적인 데이터베이스에 대 한 데이터 다른 형식에 청소 고 알고리즘 가입 일정 한 형식으로 변환 될 해야 합니다.

인간의 언어

데이터 형식은 하나만 문제 이며 다른 인간 언어의 퍼지. 요오드는 부작용 및 약물 상호 작용에 대 한 정보 제공 하는 건강 시작 이다. 그러나 같은 부작용에 대 한 FDA의 용어는 종종 약간 다르다. "졸리", "졸음"와 "졸음" 동시에 사용 됩니다. 인간은 이러한 동의어를 인식할 수 있지만 읽을이 수가를 얻기 위해 소프트웨어 알고리즘을 프로그래밍 합니다. 이 이런 계란-통증 일 데이터 프로젝트에서 반복 해야 합니다.

데이터 전문가 과정의 각 단계를 자동화 하려고 합니다. 그러나 ", 작업에는 데이터의 복잡성 때문에 당신은 환상적인 결과를 얻을 좋은 긴 시간 데이터 게이트 키퍼." "데이터 과학자와 요오드 설립자 매트 Mohebbi 말했다.

데이터 소프트웨어 이상 과학자, 시간을 절약 할 수 있는 그리고 그것은 큰 데이터 컴퓨팅에 큰 기여 수 있다.

역사의 법률 새로운 기술을 처음 몇 엘리트의 손에 되었습니다 보여줍니다. 그러나, 시간이 지남에, 기술 진보와 투자 증가, 도구는 점점 더 강력 하 고, 관련 경제 개발 되고있다, 비즈니스 운영, 주류에 결국 기술에 적응 하기 시작 했다. 빅 데이터 시대에,이 법률 여전히 작동합니다.

Cto, 존 akred 실리콘 밸리 데이터 과학의 현대 데이터 세계의 개발 및 기술 사이의 유사성을 보이고 있다. "우리는 혁명의 기원을 목격 하 고 그것은 더 큰 인구 더 수 데이터 문제 해결 만들기에 전념" 고 말했다. "

ClearStory 데이터, 팔로, 캘리포니아에서 시동 회사를 식별, 집계, 테이블 및 그래프 데이터 지도 통해 결과 시각화 소프트웨어 개발 전용입니다. 그것의 목표는 소프트웨어를 통해 더 큰 사용자 시장 개발입니다.

시각적 보고서는 일반적으로 6 ~ 8 데이터 소스를 포함합니다. 예를 들어 스캔 된 판매 데이터, 일기 예보, 웹 사이트 탐색, 경쟁 가격 데이터, 스마트폰 소프트웨어 액세스 및 주차장 교통의 비디오 감시 보고서는 소매를 포함할 수 있습니다. 그리고 데이터는 수동으로 collated입니다, 만약 그것은 충분히 않을 수 있습니다.

알고리즘은 여전히 육체 노동을 대체 하지 않습니다.

아직도, 데이터 과학자 스트레스 육체 노동은 여전히 데이터 준비에서 근본적 이다. "처음에는 특정 목표에 대 한 데이터 준비 하지만 곧 당신이 뭔가 새로운 것을 찾아와 목표 변경," 고 말했다. "캐시 오를 말한다 ' 닐, 컬럼비아 저널리즘 학교에서 데이터 과학자.

그러나 과학자 들은 데이터 통계에 압력을 줄이기 위해 그들의 칼을 날카롭게 필요가 의심의 여지가 있다. 후 모든, 工欲善其事, 그것의 전제 조건

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.