Graphlab: 생산 개념에서 대용량 데이터 분석을 적용

출처: 인터넷
작성자: 사용자
키워드: 큰 데이터 Graphlab 컴퓨터 과학

Graphlab 확장 가능한 기계 학습 시스템을 사용 하 여 큰 데이터 분석 Zillow, 어도비, Zynga, 판도라, 보쉬, 엑슨모빌, 등등을 포함 하 여 제품을 구축 하는 완벽 한 플랫폼을 제공 합니다. 그들은 다른 응용 프로그램 또는 서비스, 데이터를 캡처하고 대용량 데이터 개념 시스템 모델 추천 시스템, 사기 모니터링 시스템, 정서 및 사회 네트워크 분석 시스템을 통해 프로덕션 환경에서 사용할 수 있는 예측 응용 프로그램으로 변환 합니다.

카를로스 Guestrin 이며 공동 설립자 및 CEO의 Graphlab 워싱턴 대학에서 학습 시스템의 amazonprofessor. 세계를 학습 하는 기계에서 국제적으로 인정 받는 리더, 카를로스는 2008 "화려한 10", Ijcaicomputers 및 생각에 대 한 인공 지능 분야에서 뛰어난 기여를으로 명예 Popularscience 잡지의 번호를 받았습니다. 수상, 한편 그는 또한 미국의 젊은 과학자 상의 대통령입니다.

이 문서는 AWS 서비스에 Graphlab 최고 경영자 카를로스 Guestrin QA 콘텐츠를 기반으로 합니다.

Q: 기계 학습 무엇입니까? 지난 10 년 동안 개발 하고있다?

카를로스 Guestrin: 기계 학습 컴퓨터 모델에서 많은 데이터를 읽어서 배울 수 있는 지식을 그들은 배울 것 이다 사용할 수 기준으로 자동 정확한 예측 및 의사 결정에 대 한 가정 하는 과학 이다. 지난 10 년 동안, 우리, 온라인 저장 환경 설정, 포지셔닝 마케팅, 신용 카드 사기, 고 등 학습 무인된 차량 운전 등의 분야에서 사용 되는 기계 본. "빅 데이터" 생산과 생활을 개선 하는 통찰력으로 변환 하는 능력을 감안할 때, 다양화와 대용량의 데이터 기계 학습 뜨거운 투자 방향을 확인 합니다.

Q: Graphlab의 설립의 뒤에 이야기를 공유할 수 있습니다? 이러한 사업을 왜 시작 합니까?

카를로스 Guestrin:graphlab 프로토 타입 카네기 멜론 대학, 주도, 두 디와 박사 박사 누가 내 학생 들의 2008 년에 태어났습니다. 이전에, 팀은 고급 그래프 분석 응용 프로그램에서 일하고 있다. 특정 목표를 달성 하기 위해 그들은 높은 확장성과 도구를 구축 해야 합니다. 이러한 도구는 때 그들은 만들어진 간단한 세미나도 300 명 이상 참여, 예상 대로 10 시간을 끌었다 관심을 많이 받았습니다. 이 결과 시장 큰 수요에 있다 하지만 플랫폼 디자인의 장점을 입증을 보여줍니다. 그 당시, 팀 파괴 진행 그래프 분석 및 비동기 통신에 e c 2의 능력을 이용 했다 고 비슷한 그래프 분석 시스템에 비해 몇 배나 성능 이점이 있었다.

2012 년까지 내 아내와 나, 같은 교수 컴퓨터 과학, 새로운 일을 고려 했다. 제프 베조스는 워싱턴 대학에가 서 우리를 설득, 설립자 및 회장 아마존의 우리 부부와 함께 만났다 고 아마존 교수 위치를 공부 하는 두 워싱턴 대학 컴퓨터 식별. 그럼 우리 PNW 이동 신흥 큰 데이터 분석 분야에서 잘 하 고 싶 었 일부 재능 있는 학생 들을 만났다. Madrona 벤처와 NEA의 지원, Graphlab 회사는 공식적으로 3 월 2014에서 태어나 고 첫 번째 상용 버전 Createtm 베타 형태로 출시 되었다.

Q: 당신은 어떻게 대용량 데이터 분석을 단순화 하 고 Graphlab의 창조에 대 한 이야기?

카를로스 Guestrin: 지금, 선회 원시 데이터 통찰력 및 예측 응용 프로그램은 여전히 도전 하는 건물 및 복잡 한, 필요한 데이터 과학자 또는 이렇게 동등 하 게 지식이 소프트웨어 엔지니어. 동시에이 작품을 또한 많은 복잡 한 도구를 수집, 정리, 모델, 분석 하 고 저장소 또는 응용 프로그램에 결과 표시 합니다 필수적 이다. 대부분의 경우에 프로덕션 환경에서 프로토 타입 코드의 구현 길고 비싼 과정입니다. 그 결과, 프로그래밍 경험 없이 많은 데이터 과학자, 되며 기관 거의 그들의 데이터에서 값을 추출할 수 있습니다.

그것은 등장 Graphlab 데이터 과학자 프로그래밍 경험 없이 신속 하 게 프로덕션 환경에서 사용할 수 있는 제품으로 아이디어를 번역 하는 플랫폼을 제공 합니다. Graphlab 사용자의 많은 수, Graphlab를 만들 수 있도록 신속 하 게 생산성을 개선 하 고 많은 프로그래밍 경험 및 인력 없이 신속 하 게 가치를 제공.

질문: 그것은 aws에서 배포 예측 응용 프로그램 지원?

카를로스 Guestrin: 원시 데이터를 변환 예측 분석의 과정은 종종 데이터 과학자, 노트북, 및 대규모 테스트의 핵심 개념을 확인 해야 하는 프로토 타입으로 시작 합니다. 이 프로세스는 AWS를, 매우 쉽습니다 사실에 의해 단축 될 수 있습니다 있지만 많은 데이터 과학자, 그것은 여전히 프로덕션 환경에 대 한 코드를 구현 하기 어렵습니다.

이 Graphlab 기회를 제공합니다. Graphlab 만들 모든 AWS 환경에서 실행할 수 있습니다. 수정할 코드의 한 라인, 데이터 과학자는 AWS에 Graphlab 시 제품에 따라 그들의 노트북을 마이그레이션할 수 있습니다. 데이터 세트와 모든 규모의 모델을 로드 하 고 Graphlab AWS 클러스터 배포, 모니터링, 데이터 파이프라인 최적화 및 예측 서비스를 제공 하면서 아마존 S3에서 액세스할 수 있습니다.

Q: 몇 가지 일반적인 사용 사례를 공유할 수 있습니다? 어떻게 사람들이 사용 Graphlab 만들기?

카를로스 Guestrin: 일반적인 Graphlab 만들기 사용 다양 한 분야를 커버:

소매: 권장 시스템 및 가격 예측 (예: 항공료)

금융 서비스: 사기 예방 행위 및 무역 분석을 통해

의학: 의료 기록 분석 예측 질병, 맞춤형된 약물 설계

통신 분야: 고객 이탈 예측

소셜 네트워크 분석: 주요 네트워크 및 지역 사회에 영향을 받는 사람을 식별

시장 및 미디어: 감정 분석, 대상 잠금 기능

Q:는 뿐만 아니라 기업에서 사용 하는 응용 프로그램?

카를로스 Guestrin: 완전히 잘못. 국가 지방 자치 단체 Graphlab를 사용 하 여 민심을 분석 하 고 어떤 지역의 로컬 인프라에 관심을 지불 될 필요가, 생물 의학 연구 팀 사용 하 여 환자의 진행 예측 임상 기록을 분석 하는 GRAPHLAB 확인 다양 한 유형의 센서 네트워크는 공기와 철도 수송 안전 개선 하는 데 중요 한 데이터를 Graphlab를 사용 합니다. 일반적으로, 정부, 연구 기관, 의료 기관 및 서비스 효과적인 데이터 활용을 통해 운영 효율성을 개선 하기 위해으로 예상 된다.

Q: 그래서, 초기 기업 데이터 과학에 초점을 해야 합니까? 어떤 단계에서 신생 기업부터 시작 해야 큰 데이터에 초점을 맞추고?

카를로스 Guestrin: 모든 규모의 기업에 대 한 데이터 과학 및 데이터 기반 결정은 매우 중요. 큰 회사는 역사적인 분석에서 그냥 멈출 수 없다, 그들은 효율적으로 오래 된 고객 추천 시스템, 실시간 분석 등 첨단 예측 기법을 사용 하 여 해야 합니다. 연구 및 메모 필드의 텍스트 및 정서 분석 하 사용자의 감정을 이해 하 고 따라서 사고의 발생률을 줄일 수 있습니다. 마찬가지로, 비즈니스 모델 데이터 분석을 기반으로 신생 기업도 매우 중요 하다, 특히 판매에 대 한 마케팅, 미디어, 광고 및 다른 분야. 순간, 특정 수직 영역 또는 의료 폐기물의 분석 등의 응용 프로그램에 대 한 사용자 지정 서비스 공급 체인 최적화 및 보험 청구 전문 만들는 그들의 핵심 데이터 과학 신생이 있다.

크기에 이러한 회사의 모든은 그들이 부족 데이터 과학 자원과 컴퓨팅 파워를 하지만 데이터의 많은 일반적인 특성을 공유 합니다. 이들은 AWS와 Graphlab를 결합 하 고 확장 병목 현상을 제거 하 여 큰 데이터는 되었습니다 전환과 대 광고에서 실제 생산 하는 장점입니다.

Q: 10 년 후, 당신의 눈에서 학습 하는 기계 어떻게 큰 데이터를?

카를로스 Guestrin: 10 년 후, 비교는 현재 데이터 과학자 및 경험이 풍부한 엔지니어, 기계 학습 보다 그들은 지금 더 많은 생산성을 제공할 것입니다 더 많은 사람들의 손에 될 것입니다. 예를 들어, 비즈니스 분석가 및 라인의 비즈니스 소유자에 대 한 것에 더 의존 실시간 이익 예측 예측 서비스, 그리고 정부, 건강 관리, 제공 하 고 민간 사업자 수요에 그들의 제품에 맞게 수 있을 것입니다. 동시에 비-숙련 된 사람들을 위한 기계 학습 및 데이터 기반 의사 결정 향상 값의 독립을 인식 됩니다.

Q:graphlab에 대 한 다음 이동 무엇입니까?

카를로스 Guestrin:graphlab 인기 있는 기계 학습 경로에 위에서 설명한 "보편적인 기계 학습" 비전 달성을 목표로. 즉시 경우에 우리는 빌드의 주력 1.0 버전에서 작업 하는, Graphlab 만들 것입니다 10 월 15 일에 완벽 하 게 사용할 수. 초기 릴리스 이후에, 우리 모든 조직 하는 능력을 학습 하는 기계를 제공할 것입니다. 동시에, 우리 달성 될 더 큰 데이터 요구 사항을 볼 것 이다.

원본 링크: https://medium.com/aws-activate-startup-blog/ Graphlab-big-data-analytics-scaled-from-inspiration-to-production-a9891d059cdd

만약 당신이 최신 AWS 정보 또는 기술 문서 AWS 기술 포럼에 문의 하시기 바랍니다 더 많은 질문이 있고 전문가 나중에 응답할 경우 AWS 중국 기술 커뮤니티에 액세스 하려면 알아야 합니다.

"AWS 중국 기술 커뮤니티" 마이크로 크레딧 공개 번호, 실시간의 명령 AWS 기술 및 제품 정보를 구독!

AWS 중국 개발자, 최신 뉴스, 기술 비디오, 기술 문서, 훌륭한 기술 블로그 및 기타 관련 추진의 대부분에 대 한 아마존 웹 서비스 기술 교류 플랫폼을 제공 하는 기술 커뮤니티에서 AWS, AWS 커뮤니티 전문가와 직접 통신 하는 데 하이라이트! 신속 하 고 더 나은 이해는 AWS 클라우드 컴퓨팅 기술에 AWS 중국 기술 커뮤니티에 가입.

(번역기/Shirongyang Zebian/왕 Yuping)

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.