원/사람들의 은행 중국 신용 센터 박사 리 우 나 오가, 터보 금융 그룹 공동 창립자, 최고 위험 책임자 구 Lingyun, 중국 Unicom 네트워크 기술 연구소, 수석 엔지니어 딩 웨이
혁신적인 기술 금융 기업 ZestFinance 되었습니다 투자 및 인터넷 금융의 초점 그것의 처음부터, 그것의 독특한 경영 철학 때문에. 2013 년에 세계 제 3 자 결제 플랫폼 페이팔 공동 설립자, 미국 유명 투자자 피터 테 르 (피터 Thiel) 20 백만 달러 투자. 그것의 임무는 모두에 대 한 공정 하 고 투명 한 신용 정보를 생성 하는 ZestFinance ZestFinance의 초기 서비스는 일반 금융 서비스를 즐길 수 있도록 대용량 데이터를 통해 자신의 신용 정보를 찾아 대출-당일 대출으로 알려진 고리 그룹을 사용 했다. 모든 소비자는 불완전 한 신용 정보와 함께 사람들의 진정한 신용 상태를 증명 하는 증거를 수집 하 여 정상적인 금융 서비스에 그들의 권리를 알고 그들을 돕기 위해 희망 "좋은" 사람 ZestFinance
전통적인 레비와 소비자에 대 한 ZestFinance의 신용 평가 기반으로 두 가지 기본적인 정보: 상환 하는 소비자와 소비자의 상환의 지의 능력. 차이점은 전통적인 신용 데이터 은행 신용 데이터에 의존 하 고 큰 데이터 컬렉션의 데이터 뿐만 아니라 전통적인 데이터를 하지만 상환 능력 및 상환, 소비자의 의도에 관련 된 몇 가지 설명 위험 특성 또한 포함 이러한 상관 관계 추출 및 zestfinance (그림)의 핵심으로 위험 특성의 선택을 설명합니다. 전통적인 신용 정보의 강한 상관 관계에 비해, 이러한 데이터의 데이터 소비자 보다 상대적으로 약한, ZestFinance 큰 데이터 기술을 사용 하 여 이러한 약한 관련된 데이터의 설명 능력을 강화 하기 위해 더 많은 데이터 크기를 수집. 이 방법에서는, 큰 데이터 신용 전통적인 대출 데이터에 의존, 그것은 전통적인 편지를 제공 하 고 전체 소비자의 범위를 실현 수 없습니다 사람들에 게 신용을 수행 하 사용할 수 있습니다.
데이터 신용의 보기와 전통적인 신용 사이 비교
은행에 우수한 대용량 데이터 마이닝 기술
Zestfiance의 장점은 새로운 신용 평가 모델을 개발 하 고 더 큰 데이터에서 소비자의 신용 정보를 찾기 어려운 발굴 수 있는 데이터 마이닝의 강력한 능력.
다른 응용 프로그램에는 대용량 데이터의 서로 다른 이해 그리고 현재 통합된 개념이 없습니다. ZestFinance의 설립자 이자 ceo 인 메 릴 (더글러스 C.merill) 믿고 "더 많은 데이터"는 "빅 데이터", 조각난된 정보 양식 정말 유용한 큰 데이터를 통합 하기 위해 기술을 사용할 수 있습니다. 큰 데이터의이 이해는 신용의 기본 과정은 또한 완벽 하 게 소비자의 신용 상태를 설명할 수 있는 글로벌 정보로 다른 대출 기관의 가능성 유용성에 분산 지역 정보 통합 하기 때문에 신용 카드 업계에 대 한 특히 유용 합니다.
그것은 ZestFinance 큰 데이터 기술을 사용 하 여 신용을 수행 하는 지적 가치가 그것은 주로 덜 복잡 한 대형 데이터 형식의 텍스트 등 소셜 네트워크 데이터를 활용 하는 큰 구조적된 데이터 활용 주된 이유는 이러한 복잡 한 큰 데이터 및 ZestFinance 서비스 소비자의 신용 위험 상관 관계는 너무 약한입니다. 이 현상은 또한 다른 인터넷 뱅킹 사례, 가장 큰 인터넷 피어-투-피어 회사, 대출 클럽, 먼저 착륙 신용 시장에 페이스 북에서 입증 효과 지속, 소셜 네트워킹 데이터에 대 한 신용을 통과 기대 등 확인 마지막으로 전통적인 신용 수단 개발에 반환 했다.
ZestFinance의 핵심 역량 모델 개발, 데이터 마이닝의 강한 능력에 속이 고 기계 학습 분야에서 더 성숙한 기술로 기존의 신용 위험 관리 분야에 창조적으로 적용 됩니다.
열쇠는 다차원 데이터 및 알고리즘
Zestfinane의 핵심 비즈니스는 소비자 신용 승인, 주요 고객은 서브 프라임 소비자, 주요 경쟁사는 은행이 나 전당포 상점. ZestFinance의 핵심 역량 모델 개발, 데이터 마이닝의 강한 능력에 속이 고 기계 학습 분야에서 더 성숙한 기술로 기존의 신용 위험 관리 분야에 창조적으로 적용 됩니다.
전통적인 신용 점수 모델 일반적으로 데이터 항목이 500, 50 변수 추출 되 고 예측 분석 모델을 사용 하 여 신용 위험에 대 한 양적 평가. Zestfinance의 새로운 모델에서 3500 데이터 항목이 사용 됩니다, 있는 70000 변수 추출 되 고 10 예측 분석 모델 사용 됩니다 통합된 학습 또는 다 각 학습에 대 한 최종 소비자 신용 점수.
그림 2에서와 같이 ZestFinance 데이터 소스 큰 데이터, 수 만명의 위험 변수 생성 이며 다음 사기 모델, 인증 모델, 선불된 기능 모델, 상환 능력 모델, 상환 의도 모델 및 안정성 모델 등 다양 한 예측 모델을 입력. 각 모델 다른 각도에서 개별 소비자의 신용 상태를 예측, 기존의 신용 평가 모델 고려의 한계를 극복 하 고 더 세심 한 예측을 만드는.
기계 학습 방법 통합된 학습 기계 학습에서 가장 인기 있는 연구 방향으로 생산, 연구 및 생활에 널리 사용 됩니다. 통합된 학습 기계 학습 알고리즘 모델을 분석 하 고 예측, 그리고 일부 규칙을 단일 알고리즘 모델 보다 더 나은 예측 효과 얻기 위해 각 모델의 결과 통합 하는 사용의 시리즈를 사용 하는 방법 이다.
단일 모델 결정 권 자에 비교 하는 경우 통합된 학습 접근법은 여러 의사 결정을 함께. 때문에 여러 가지 정보 및 여러 의사 결정 메커니즘의 통합, 분석 및 통합된 학습의 예측 보다 낫다 단일 모델의. 다른 각도에서 정보 관련 서로 보완적인 정보를 포함 하 고 다 각 학습 과정, 즉 증거를 수집 하 고, 상호 보완적인 정보를 강화 하 고 정보를 병합 하는 과정에 해당. 예를 들어 두 개의 독립 채 점 모델은 16.9%와 9.4% 증가, 수익성에의 두 번째 모델 전통적인 신용 평가에 삭제 될 수 있습니다 하지만 두 모델 보완 정보를 포함할 수 있으면 두 모델의 결과 38% 이익 증가 융합 될 수 있습니다.
이러한 다중 각도 학습 모델의 각 전통적인 논리 회귀, 하지만 기계 학습 (모델의 세부 정보는 zestfinance에 대 한 핵심 비밀)에 다른 예측 모델을 사용 하지 않습니다. 로지스틱 회귀 모델 ZestFinance의 신용 평가에 사용 되지 않습니다 이유는 큰 데이터 컬렉션의 데이터 조각화 상대적으로 변수가 너무 많은, 그리고 위험 변수의 분포는 정규 분포를 만족 시킬 수 없다.
신용 승인 관리 압류 위험의 80%를 제어할 수 있습니다.
조사, 신용 승인 링크에서 신용 리스크의 약 80%는 소비자 신용에 대 한 액세스, 일단 후속 관리만 20%의 위험을 제어할 수 있습니다, 그리고이 과학적인 신용 승인 관리는 매우 중요 합니다 보여줍니다. 높은 품질 신용 심사 및 승인 점수 모델을 개발 하 고 과학적인 시험 및 승인 위험 수행 하 관리 크게 나쁜 부채 율을 감소 고 더 나은 경제적 이익을 얻을 수 있습니다. ZestFinance 경쟁 은행 또는 담보 대출에 비해 실제 응용 과정에서 그것의 나쁜 부채 비율을 공개 하지 않았다 비록 그들은 몇 가지 좋은 결과 달성 했다.
1입니다. 대출 고객을 얻기의 비용은 경쟁 업체의 그의 25%입니다. 온라인 대출에 대 한 JMP2012의 산업 보고서, 고객 획득 평균 비용 250, 500 달러 사이 이어야 한다. 2014, ZestFinance 서비스를 통해 고객을 얻기의 비용은 약 100 달러에 안정적입니다.
2입니다. 첫 번째 지불 기본값, FPD에 대 한 기본 요금 경쟁 같습니다. 2012 년부터, ZestFinance의 첫 번째 대출 기본 속도가 여전히 변동, 제 3 경쟁자, 2013 년까지 모델의 지속적인 개선으로 기본적으로 안정적이 고, 3 경쟁사 보다 훨씬 낮은 되었습니다 보다 때로는 더 높은.
3입니다. 지속적으로 고객의 투자 수익을 향상 시킵니다. ZestFinance의 초기 투자 수익률은 약 100%, 고 모델 개선, 150% 이상에 도달 하는 고객 투자 수익의 현재 속도.
4입니다. 투자 수익률 경쟁자의 그것 보다 높은 수준 이다. II ZestFinance의 투자의 비교를 보여주는 서로 다른 시간에 그것의 경쟁자와 함께 반환 합니다 표시 그림 ZestFinance의 투자 수익 업계 표준 및 그것의 경쟁자 보다 훨씬 높다.
그림 2 차 ZestFinance 경쟁사 보다 높은 투자 수익
Zestfinance 신용 평가 모델에
Zestfiance의 장점은 데이터 마이닝, 새로운 신용 평가 개발의 그것의 강한 기능 모델 (그림 III 참조), 그리고 더 큰 데이터에서 소비자의 신용 정보를 찾기 어려운 밖으로 파고.
점수 모델은 지속적으로 ZestFinance 계속 데이터를 수집 하 고 새 데이터 원본 추가 업데이트 되 고. 테이블 하나 같이 새로운 신용 평가 모델은 현재 2012 년부터 거의 모든 분기에서 소개 된다. 그리고 모델은 모든 다른 개발자 이름을 따서 지금 14 모델은. ZestFinance 점수 모델의 개선 또한 신용 위험 평가의 수준을 향상. 이러한 새로운 모델 얼굴 데이터 적합성 및 데이터 가용성의 도전 아직도, 하는 동안 모델의 지속적인 개선 진행 중 이다.
그림 3 ZestFinance의 신용 평가 모델의 해석
ZestFinance 먼저 신용 승인만 신용 평가 모델에 종사 하 고 새로운 신용 리스크 비즈니스의 지속적인 도입을 지원 하기 위해 그것의 평가 모델을 지속적으로 수정. 컬렉션 점수 2013 년 1 분기에 소개 되었다 표 에서처럼 나, 그리고 마케팅 점수 2014 년 2 분기에 소개 되었다, 자동차 융자 및 법적 미리 2014 년에 발사 되었다 다른 신용 위험 평가 서비스에 대 한 8 개의 신용 평가 모델 개발 되었습니다.
테이블 A zestfinance 신용 평가 모델
데이터 (누락)의 손실 기계 학습에는 여러 가지 이유로 인해 누락 된 일부 데이터 항목을 참조 하며 데이터의 더 손실을 모델링 과정에 도전 포즈. zestfinance 다차원 정도의 큰 데이터 사용, 데이터 손실 현상 이므로 더 유명. 손실 된 데이터의 ZestFinance 처리는 그것의 자신의 유일성. 첫째, ZestFinance 지속적으로 향상 손실 된 데이터를 처리 하는 능력을 향상 시키기 위해 그것의 점수 모델 그리고 최신 점수 모델 30% 이상 손실 된 데이터를 처리할 수 있습니다. 둘째, zestfinance 전체 함으로써 데이터 손실의 원인을 탐구 하는 손실 된 데이터와 정상적인 데이터의 교차 상관 관계의 사용 합니다. 같은 깊은 갈기를 통해 몇 가지 유용한 소비자 신용 정보 얻을 수 있습니다. 이것, 물론, 특정 환경, 신용 작업의 조합을의 사용 및 소비자 행동 패턴에 대 한 깊은 이해가 필요합니다.
중국의 신용 업계에 큰 데이터 신용의 계시
ZestFinance의 초기 서비스는 일반 금융 서비스를 즐길 수 있도록 대용량 데이터를 통해 자신의 신용 정보를 찾아 대출-당일 대출으로 알려진 고리 그룹을 사용 했다. 모든 소비자는 불완전 한 신용 정보와 함께 사람들의 진정한 신용 상태를 증명 하는 증거를 수집 하 여 정상적인 금융 서비스에 그들의 권리를 알고 그들을 돕기 위해 희망 "좋은" 사람 ZestFinance
대조적으로, 현재 국내 신용 리스크 관리, 처벌이 강하다 너무, 유사한 "죄과 추론," 좋은 방법,이 접근의 아이디어 간단 하 고 효과적인, 있을 수 있습니다 하지만 신용의 역할을 발휘를 포기 하지 않았다. 신용의 진정한 역할만 믿음의 위반을 처벌 하는 것 이지만 더 중요 한 것은 무결성을 칭찬. 모든 소비자 신용, 과학의 힘을 Pu 희 재무, 개발 촉진을 위한 ZestFinance 서비스의 풍부한 원형에 대 한 신용 기관 휴식.
특정 서비스 그룹을 타겟팅 하는 것은 또한 zestfinance 성공의 열쇠입니다. ZestFinance의 주요 고객은 인구의 약 5% 이며 신용 점수 500 아래. 이 부분은 소비자의 심층적인 이해를 통해 대형 데이터 설명 정보, 개발의 심사 또한 효과적인 신용 승인 모델의이 그룹에 타겟팅 됩니다. 기계 학습 분야에서 아무 특별 한 일반적인 분석 모델 하지만 그것은 종종 특정 범위에 대 한 효과적인 모델을 했다. 따라서, 신용 분석 모델을 개발 하 고도 하는데 제대로 서비스 그룹 서비스 개체 이해 신용 서비스 비즈니스를 수행 하는 키입니다.
또한, ZestFinance는 그것의 경쟁자와 전통적인 신용 기관에 우수한 왜 중요 한 이유는 강한 신용 점수 모델을 개발 하는 기능: 다중 각도 학습, 업데이트 하 고 적시에 정제를 기반으로 하는 모델. 반면, 중국의 신용 승인, 또는 신용 위험 관리, 간단한 양적 의사 결정, 전체 정량 분석 하는 질적 판단에서 고르지 못한 수준을 충분 하지 않습니다 하 고 신용 평가 기관 아직 시작 하지 했습니다. 우리는 양적 신용 위험 분석 기술의 투자를 강화 하 여 소비자 신용의 전문 리스크 관리를 실현할 수 있습니다. 동시에, 큰 데이터 나이 강조 하는 그 가치가, 기성 품 무료 점심 없음, 데이터 이며 모델 중국, zestfinance 모델을 직접 사용할 수 없습니다 경우에 데이터 과학자는 인간에 참여, 세련 될 필요가. 데이터 및 소비자의 이해와 데이터 마이닝 기법의 숙달 모델링 과정에서 생략할 수 없는 교훈입니다.
(이 기사는만 단위에 담당자의 개인적인 의견 이다.) )
(책임 편집기: Mengyishan)