큰 데이터 플레이어가 베이 밝히기: 구입 하려는 것 같아요

출처: 인터넷
작성자: 사용자

온라인 세계에서 데이터는 돈을. 세계 최대 경매 사이트가 베이이의 깊은 이해는 있다. 지금, 다양 한 온라인 데이터 베이의 분석 각 고객 앞에 설치 하는 카메라 처럼 사려 깊 음 이다. 그이 베이 데이터의 엄청난 금액을가지고 의심의 여지가 있다. 컴퓨터 데이터의 50 결핵을 포함 하 여 매일 100PB 데이터의 처리 합니다. 이 베이, 그것은 수 면 천문 데이터 도전 매일 했다.

일찍 2006 년,이 베이 대규모 데이터 분석 플랫폼을 설정합니다. 정확 하 게 사용자의 쇼핑 행동 분석,이 베이 데이터의 종류의 수백을 정의 하 고 고객의 행동 분석. 그러나, 그것은 또한 ebay에 대 한 새로운 도전 포즈. 알다시피, 회사의 데이터 볼륨이 너무 상상, 아무도 너무 많은 데이터를 소화할 수 있다 그리고 아무도 모든 데이터에 기반 하는 모델을 작성할 수 있습니다. 사실, 어떤이 베이 정말 적용 됩니다 수집 하는 데이터의 작은 부분만 이다. "데이터의 나머지,이 베이 그것을 삭제 하거나 저장 합니다." 때문에 어쩌면 언젠가, 기술 돌파구를 만들고 데이터를 유용 하 게 됩니다. "린, ebay 중국의 CEO는 말했다.

그래서 지금 어떻게이 베이 사용 합니까이 데이터 비즈니스 혁신 및 이익 성장을 촉진?

사용자가 "초상화"

Ebay는 거의 200 백만 사용자, 그리고 사이트의 목록 항목에 30000 개 이상의 종류가 있다. 일상적인 거래 플랫폼의,에서 베이 거의 초 당 달러의 수천을 처리 합니다. 이러한 거래는 실제로 "빙산의 일각" ebay의 총 데이터의.

대용량 데이터 분석을 바탕으로, ebay는 매일 대답 질문의 같은 "무슨 어제 인기 검색 항목?" 수가 있다. "그리고 심지어 같은 간단한 질문의 페이지 뷰 5 십억 처리 해야 합니다." 이 관점에서 어떤 기본적인 비즈니스 문제는 회사에 대 한 거 대 한 문제가 이다.

린 A 어떻게이 베이를 사용 하 여 큰 데이터 온라인 거래 증가의 고전적인 예입니다. 예를 들어 젊은 여 자가 아침에 10에 스타벅스에 서이 베이 사이트를 탐색, 무엇이 베이 줘야 그녀?

우리는 실제로이 지점에 대 한 연구를 많이 했. "사실 때 사용자는 아침, 정오, 12 시에서 10 시 또는 7 시에 밤에, 그녀는 다른 항목에 탐색 식당에서 또는 가정에서, 또한 영향을 미치는 탐색 및 검색, 그리고 사용자에는 시간, 날씨의 나이 쇼핑에 영향을 미칠 것" 린 했다. 다른 시나리오에서 다른 쇼핑 패턴 학습과 가장 원하는 제품을 밀어은 어떤이 베이 경매 할 수 있다입니다. "

그것은 보고 그이 베이 사용자의 이전 검색 레코드 "추측"에서 어떤 종류의 상품을 원하는 당신은 또한 무엇 사용자 시나리오의 수백의 집합에서 원하는 또는 유사한 특성을 가진 다른 여성 사용자에 대 한 사용자의 어떤 종류의 상품 구입, 했으며 다음 유추 가능성 필요한 알아낼 수 수 있습니다. 다양 한 고려 사항, 합성 후이 베이 백엔드를 단 몇 초에 사용자에 게 제품 페이지를 밀어 필요가 있다. 즉,이 베이 시스템 매우 빠른 컴퓨팅 속도 필요.

이 모델 작업의 인공 요인의 상당수 있다. 예를 들어 기계 수만 사용자의 데이터를 수집할 수 있습니다 하지만 베이 엔지니어 유효한 데이터, 데이터의 100를 정의할 수 있으며 모델이 유효한 데이터 기반. 또한, 컴퓨터 자동으로 ""을 배우고 다양 한 데이터의 형성에서 경향을 분석 때이 베이 상품 거래와 관련 된 동작에서 학습 기계의 논리를 설정 하려면 필요 합니다.

사용자가 "초상화" 대용량 데이터를 통해 대상된 상품을 밀어 이외에 베이 이전 큰 데이터를 사용 하 여 검색 엔진 최적화에 대 한 노력 했다.

특히,이 베이 더 "직관적." 시간은 뒤로 몇 년 동안, 경우 사용자가 그 때 그들은 베이 검색 엔진을 사용, 그들은 수만 있습니다. 발견할 것 이다 검색 엔진 리터럴 의미를 이해 하 고 그대로 찾고 사용자의 행동 패턴을 파악 수 있습니다. 대부분의 시간, 검색 엔진 사용자의 진정한 의도 이해 하지 않습니다. 하지만 지금,이 베이 변경 또는 사용자의 검색 요청을 다시 작성, 동의어 또는 대체 문을 추가 더 많은 관련성을 포기 하 고 증가 온라인 거래 하려고. 그리고이 뒤에 모든 큰 데이터의 지원에서 분리할 수 있다.

가맹점에 제공 하는 "지능"

이 베이 또한 기업 다양 한 "정보" 기반으로 사용자 쇼핑 데이터. 예 제공, ebay 말할 것 이다 제조 업체 제품 그들은 인터넷, 또는 다양 한 수출 산업, 그리고 제조 업체에서 데이터에 대 한 검색 하 고는 즉시 반응할 것 이다.

대부분의 시간,이 베이 기반 자체 또는 다른 전자 비즈니스 거래, 그들은 판매 한다 카테고리 추천 가맹점 사이트. "이것은 또한 ebay에 더 중대 한 중국에서 수행 되는 작업과," 린 고 말했다, "예를 들어 중국 실업 호주 제품을 판매 하 고 싶어, 우리가 말할 수 있는 그 데이터 분석, 그가 수에 의해 판매 가격, 얼마나 많은 제품에 대해 약 1 개월 범위에 있어야, 동일한 제품을 판매 하는 시장에 있는 많은 기업 그의 시장 점유율은 아마도 많은. "

이 기초에, ebay 또한 공급 업체의 보충 주파수를 알아낼 려 고. 사실, 일단 계산 오류, 그것은 재고 백로그를 발생할 수 있습니다 또는 재고 비즈니스 매우 두통 문제입니다 해외 창 고. 그리고이 베이, 일단 사용자 재고 사업을 찾아내는 순서, 매우 심각한 문제. 이 경우에,이 베이 보충, 물류 및 얼마나 오래 시간 때 판매의 속도 해야 과거에 뿐만 아니라 상품 판매의 첫 번째 일괄 처리를 찾을 수 과거 데이터 분석을 통해 할 수 있다. 이러한 데이터의 계산을 통해이 베이 공급 업체 보충의 논리를 계산할 수 있습니다.

이러한 데이터 분석은 새로운 판매 카테고리를 개발 하는 기업에 대 한 유용 합니다. 일반적으로 상품의 짧은 시즌의 판매 그리고 얼마나 인기가 수 상인에 대 한 4 ~ 5 개월 소요 때문에 그들은 모든 지역에 있습니다.

물론, 어떤이 베이 이다 제공 하는 기업 다양 한 잠재적인 비즈니스 기회를, 판매자, 생산에 투입 하 게 기꺼이 여부 또는 구입, 여전히 완료 하는 데 필요한 올바른 공급 업체를 찾을 것인지. 대부분의 시간,이 베이 판매 200 새로운 카테고리, 추천 하 고 최종 사업만 50 새 제품 공급 업체를 찾을 수 있습니다.

그 위에,이 베이 플랫폼에서 생성 된 모든 정보 품질 관리 (QC)의 역할을 재생할 수 있습니다. 예를 들어 판매자 ebay 때 50 제품을 판매 했다, 질문 5 제품, 200 제품, 20 제품 질문, 400 제품, 40 제품 품질 문제, 출연에 1000 제품을 판매할 예정 이다 등등. 그들의 이른 문제에 대 한 시간에 판매자에 게 경고 하은 어떤이 베이 경매 할 수 있다입니다.

또한, 판매자는 10 또는 20 제품을 판매,이 베이 회수율, 구매자 리뷰에 따라 가능한 문제를 감지 해야한다. 동시에이 베이 판매자 공급 업체 품질, 향상 하거나, 제품을 넣어 하거나 기사의 설명을 수정 하기로 그들을 생각나 게 합니다.

이상적으로, 품질 관리 시스템 큰 데이터 루프를 형성 하 고 반환을 줄이고 더 많은 상품을 판매 하는 판매자 도움 것 이다. 경우 판매자는 아직도 그들의 자신의 방법으로 이러한 통지를 받은 후,이 베이 거래에 판매자 상품, 가치 되지 않습니다 및 일부 단계에서이 베이 "할당량" 부과할 것 이다을 추측 하 고 그것의 거래량을 제한.

"품질 관리를 가진 어려움은 내가 문제를 찾을 경우 판매자는 작은 트랜잭션 볼륨 데이터 모델을 사용 해야," 고 말했다. 이 초기 예측은 복잡 한 작업을 포함 한다. "볼륨은 큰, 일단 판매자 스스로 수 있을 것입니다 손실 가역 전에 반환 율을 계산," 린은 말했다. "

시행 착오와 도전

마찬가지로 다른 온라인 거래 플랫폼,이 베이입니다 또한 가짜에 민감합니다. 지금, 회사는 시스템을 "스마트" 큰 데이터 기술을 통해 가짜를 식별 하 게 하고있다.

사실, "사이버 위조" 일은 쉽지 않다. 알고, 가짜 자주 네트워크에서 다양 한 형태로 나타나고 반복적으로 금지. 가짜 상인 추가할 수 있습니다 예를 들어, 롤렉스를가지고 단어, 공간 또한 두 편지 교환 위치에 배치할 수 있습니다, 심지어 이름이 롤렉스 표시 되지 않습니다, 그냥 사진이 롤렉스 시계 모양을 보여줍니다. 자연 스러운 다양 한 가짜는 ebay에 너무 많은 상표가 있다. 이 경우에, 이름 또는 제품의 설명에 키워드를 단순히 잡고 여는 가짜를 파악 수 없습니다.

어떤 ebay 지금 하 고 있는 모델 또는 규칙을, 상인의 거래 특성, 또는 규칙을 따르는 경우 판매 수 있습니다 가짜 데이터 분석을 통해 만드는 것입니다.

예를 들어, 판매자의 상품 아주 싸게 판매, 불만 많이 다시 하지만 신속 하 게, 판매 및 반환 합니다, 시스템 식별, "의심 스러운" 패턴 및 다음 판매자 판매 여부를 결정 하기 위해 직원 가짜 때. 즉, "데이터의 양이 큰 경우에 가짜를 판매 하는 사람들은 상대적으로 고정 패턴." "린 고 말했다. 이 방법에서는,이 베이 효과적으로 가짜 기업 수를 식별합니다.

그러나, 린 같은 큰 데이터 분석 방법 또한 단점이 있다는 인정을 주저 하지 않습니다. "의 경우 가짜,이 이렇게만 문제에 다시 추적 될 수 있다 고 미리 예측할 수 없습니다." "그것은 쉽지 않다를 해결 하기 위해 어떤 모델을 사용 하 여, 아무리 가짜 무역 수 있습니다 항상 당신에 게 거짓말 한 동안 때문에," 라고 말합니다. "

분석의 지연 뿐만 아니라 ebay의 큰 데이터 문제는 거 대 한 데이터 처리에도 반영 됩니다. 엔터프라이즈 데이터 웨어하우스 쿼리에 뛰어난 성능을 제공, 하지만 그것은 여전히 맞지 않습니다이 베이 저장소 및 유연한 처리의 요구. 알다시피, 이러한 시스템 비용 많은 돈, 그리고 ebay 매일 50 t B의 데이터를 추가, 그것은 비싼.

이 기초에,이 베이 현재 쓸모 없는 데이터로 볼 데이터의 상당한 부분을 수집 합니다. 모든 후, 더 많은 데이터를 수집, 거기에 더 많은 변수는, 그리고에서 더 많은 결과 "소음", 더 왜곡 모델. 이 관점에서이 베이 할 수 있다 기록 의미 있는 데이터 이며, 원치 않는 정보를 파괴. 린 인정 문제는 질문 ebay의 85%는 새로운 또는 알려지지 않은, "이 베이 정보 미래에 유용할 수 있습니다 몰라"를 분석 하 고 싶어. "지금 효과 없는 보이는 그 데이터는 아마 소화 기술 진행으로 다음 몇 년 동안, 그리고 우리가 지금 그 데이터를 저장만." "

하지만 다른 경우에, 모든 정보를 저장 하는 경우이 베이 매월 추가 됩니다 데이터의 수백만의 수백. 이러한 데이터의 광대 한 바다, 분석 작업은 전혀 할 수 없습니다. 그래서이 베이, 균형 해야 하는 문제입니다.

그것은 ebay의 현재 분석 모델 만큼 완벽 하지 않습니다 주목 해야한다. 여부 그것의 "추측" 사용자 또는 ebay에 분석 사업,이 베이 훨씬 더 잘못입니다. 대 한이, 린 신용 카드 예제. 그의 관점에서 "은행은 가장 강력 하 고, 큰 데이터를 사용 하 여 실제로 하지만 어떻게 완벽 한 바람 제어 모델에 상관 없이 세계 아직 신용 카드의 약 2%." "또한,이 베이 사용 되지 않습니다 성숙한 기관 인증 모델, 여러 번 그들의 자신의 지에 의해 추측 하 고, 다음 오류 놀라운 일이 아니다."

(책임 편집기: Lvguang)

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.