키워드:클라우드 컴퓨팅 오픈 소스 독 노동자 hadoop openstack eharmony
"에디터의 참고" 개성을 통해 미국 eharmony에 가장 큰 데이트 사이트 중 결혼, 모든 eharmony 사용자에 맞게 테스트, 심리학자에 의해 먼저 신중 하 게 대답 해야 합니다 설계 치수, 수십의 사용자의 성격을 이해 하는 eharmony 질문의 수백 그리고 적절 한 연락처 개체를 소개 하는 사용자에 게이에 따라. OpenStack, Hadoop, 불꽃, 독 노동자 기술 개발, CTO Thod 구 엔 그들이 적극적으로 이러한 기술 수용 말한다.
다음은 번역입니다.
계획은 2013 년에 시작 하 고 것으로 예상 된다 2015 년 말까지 끝내 구 엔 최근 인터뷰에서 저에 게 말했다. 사설 클라우드 환경으로 eharmony의 기존 가상화 기반 데이터 센터에 대 한 하나의 큰 이유 오픈 소스 OpenStack 클라우드 소프트웨어를 실행 하는 욕망 이다. 이 회사를 줄 것 이다 확장 하 고 가상 서버 및 스토리지, 웹 사이트 및 모바일 애플 리 케이 션을 강화 하는 등 인프라 구성의 유연성.
eharmony의 비즈니스는 시스 코의 UCS 블레이드에 설치 (서버 조용히 Cisco의 수십억 되고있다 달러의 비즈니스), 회사는 그 절반, 현재 1000 컴퓨터에서 웹 서버 수를 잘라 싶어 지금 회사 또한 관리 2000에 대 한 다른 장치.
시스 코의 블레이드 서버
EHarmony은 또한 Cloudstack 기술 Citrix 시스템에서 지 원하는 오픈 소스를 공부 하지만 구 엔 OpenStack 더 확장 될 것으로 보인다. OpenStack 많은 대형 IT 기업과 더 많은 사용자를 지원 하고있다, 비록이 그들의 평가 적용 되지 않습니다.
"소프트웨어 정의 스토리지 솔루션의 일환으로, 그것은 더 유연 하 게 공유 저장소에 OpenStack는 스위프트 구성 요소에 의해" 구 엔 추가, "우리 진짜 궁극적인 목표 저장 규모 최소한의 운영비와 기 하 급수적으로 성장할 수 있을 것입니다." "
하지만 구 엔 운영 효율 eharmony의 새로운 접근 OpenStack에서 멈추지 않을 것입니다 회사 또한 배포 및 분산된 응용 프로그램의 관리를 단순화에 대 한 인기 독 노동자 컨테이너 기술을 고려 하 고 어떤 경우에 그들은 찾아보기 수 있습니다"공용 클라우드 솔루션 "。 eharmony는 개념 증명 및 재해 복구에 AWS를 사용 하 고, 그는 덧붙였다.
"우리 수 있습니다 쉽게 해결책이 박사 박사 데이터 센터에 투자 하지 않고 요청 공공 구름에서 실행 되 고 박사 데이터 센터에 투자 하는 것은 우리를 위해, 매우, 매우 비싼 독 노동자 개념을 사용 하 여," Nguyen 고 말했다.
Thod 구 엔
하지만 eharmony는 또한 수집 하 고 많은 분석 데이터의 구 엔은 앞으로 몇 년에 PB 수준을 도달할 것으로 예상 하 고 512 노드 Seamicro 장치에서 실행 되는 이전 Hadoop 환경, 확장 및 혁신에 걸림돌이 되고있다. 각 작업 필요 자체 클러스터, 구 엔 설명, 즉 다른 모든 장치 동일 하 고 동일한 데이터를 다시 복제 하는 데 필요한.
원사 자원 관리 프레임 워크를 실행 하는 단일 클러스터로 이동 회사에 많은 혜택을 가져올 것 이다. 첫째, 그것은 여러 개의 작업 부하 및 서버, 공유 하는 동일한 파일 시스템의 동일한 세트에 프로세스 프레임 워크를 호스팅할 수 있습니다. 그것은 또한 확장할 수 있습니다 가로 수요, 보다는 512 노드 한 번에.
공유 Hadoop 클러스터는 상업적으로 중요 한, "설명 구 엔 했다." eharmony 더 많은 편의와 새로운 대형 데이터 응용 프로그램을 시작할 수 및 덜 입력, 그리고 원사 eharmony 스파크 및 가속된 기계 학습 작업에 대 한 폭풍을 스트리밍 같은 새로운 기술에 초점을 시작할 수 있습니다 의미 합니다.
대부분의 데이트 사이트와 마찬가지로 회사의 매칭 알고리즘에 대 한 가장 잘 알려진 반면, 구 엔 말한다 더 나은 데이터 인프라 또한 가격 최적화 및 사용자 경험을 포함 한 비즈니스에 대 한 더 나은 모델을 가져올 것 이다.
Hadoop 프레임 구성에 Hortonworks 원사
"우리의 목표는 정말 오른쪽 기능, 매우 매력적인 고객의 올바른 기능 집합을 제공할 수 있는 데이터 제품을 만드는 것 입니다" 고 말했다. "우리가 해야한다 그들 그들이 원하는 하기 전에 제품." "
eharmony의 기술 변환, 데이터, 특히 측면은 우연이입니다. 사실, 지난 1 년 또는 2, 스파크, 폭풍과 카프카 기술을 더 대화형 또는 실시간으로 데이터를 분석 하 고 정기적으로 기계 학습 모델을 반복 가능한 만드는 중요 한 포인트에 도달 하기 시작 했습니다.
"나는 큰 데이터 너무 많이 흥 되었습니다 생각," Nguyen 고 말했다. "많은 사람들이 큰 데이터를 하 고 있는 하지만 그들은 단지 데이터를 저장 하 고 그들은 실제로 데이터와 아무것도 다하고 생각 합니다." "
원래 링크: EHarmony은 Hadoop 및 (아마) OpenStack (Zebian/웨이 웨이) 위에 자체를 다시 작성 하는 이유
중국의 대형 데이터 수상 조사 활동, 23 응답 질문에에서 참여 해야한다 2700 원 수상 (10 총)의 가장 높은 값을 가져오는 기회 CSDN 초대 그것에 참여 하도록 속도!
국가 대형 데이터 혁신 프로젝트 선택 활동 풀 스윙에도, 자세한 내용은 여기를 클릭 하십시오.
2014 중국 큰 데이터 기술 회의 (기술 컨퍼런스 2014, 2014 BDTC)는 14 크라운 프라 자 호텔, 새로운 운 남, 2014 년 12 월 12 일에 개최 됩니다. 유산 후 7 강 수, "중국의 큰 데이터 기술 컨퍼런스" 2008 년 이후 현재 가장 영향력 있는, 가장 큰 대규모 데이터 필드 기술 이벤트입니다. 이 세션에만 수 없습니다 이순신 Liu와 Apache Hadoop Tez 프로젝트 관리 위원회 Bikas 위원 Apache Hadoop 제출자 uma maheswara Rao G (프로젝트 관리 위원회의 회원)에 대해 배울 수 없습니다. 사 및 일반 대용량 데이터의 다른 공유 Tencent, 알리, Cloudera, 링크 드 인, NetEase 및 기타 기관에서 드라이 제품의 수십의 공유 뿐만 아니라 최신 성과 및 개발 동향의 소스 프로젝트를 엽니다. 제한 된 티켓 할인에 대 한 사전 예약이 촉진 됩니다.
"CSDN 큰 데이터" 마이크로-편지 공개 번호, 실시간의 이해 최신 큰 데이터 진행에 무료 가입!
CSDN 큰 데이터를 큰 데이터 정보, 기술에 집중 하 고 경험을 공유 하 고 토론, Hadoop, 스파크, 임 팔 라, 폭풍, HBase, MongoDB, SOLR, 기계 학습, 지능형 알고리즘 및 기타 관련 큰 데이터 뷰, 대용량 데이터 기술, 대용량 데이터 플랫폼, 대용량 데이터 연습을 제공 하 큰 데이터 산업 정보 및 기타 서비스.
이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이
페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.
커뮤니티에서 표절 사례를 발견한 경우
info-contact@alibabacloud.com
으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.