나 http://www.aliyun.com/zixun/aggregation/14294.html에 게 연락 했다 "> 큰 데이터:
1. 미국 프리즘 프로그램
2. 며칠 전, 뉴스 애플 사용자 개인 정보를 훔쳐 보고
3. 바이 두의 사용자 검색 습관 통계 분석
4. Taobao 사용자 쇼핑 습관 분석, 스마트 추천 아기
5. 스마트 태그 페이지 브라우저에 대 한
...
가장 큰 데이터 아키텍처와 알고리즘을 이해 하려면:
1. 유명한 Google 페이지 순위 알고리즘: PageRank
2. 유명한 클러스터링 알고리즘: K-평균
7. 장바구니
3.c4.5
4.k-수단
5. SVM
6. Apriori
...
큰 데이터 응용 프로그램에 대 한 동향과 미래 과제는:
가장 큰 문제는 기술 데이터 자체, 하지만 인식 및 데이터에 대 한 태도 아니다. 많은 인터넷 기업 들이이 존중에 더 나은 할 그들은 동시에 데이터의 재산을가지고 강한 이익 수요, 다양 한 데이터, 소란을 만들 수 있고 많은 전통 산업, 특히 정부, 그들은 여전히 많은 관심을 지불 데이터를 그리고 더 보다 인터넷 기업 관심을 지불 해야 하지만 관리에 대 한 종종 조직 혜택 및 보안 고려 사항 포괄적인 이용을 달성 하기 어려운 섬의 형성 될.
다른 한편으로, 도전 이며 성공적인 대규모 데이터 구축 응용 프로그램 비즈니스 논리 및 데이터 처리 기술, 더 깊이 이해 해야 하기 때문에 비즈니스의 요구 사항을 직접 기본 아키텍처의 설계와 알고리즘 및 전통적인 거래 시스템에서 매우 다른 툴의 선택에 영향을 해명 하기 어렵다. 이제 일부 산업 소프트웨어 + 데이터베이스 + 하드웨어 부문 노동 모델의 큰 데이터 응용 프로그램 개발에 적합 하지 않습니다 시장 회사의 전반적인 구조에 대 한 다양 한 요인의 포괄적인 배려는 많은 수 있습니다.
추세의 나의 이해의 도구, 지금 기술 수준 기술 백 내부 상황, 이유는 오픈 소스 프로젝트 운영 모드는 더 성숙, 다른 한편으로, 대용량 데이터 처리 분석 다양 한, 미래, 오랜 동안이 상황을 유지할 것 이다 생각 전통적인 소프트웨어 개발 점차적으로 이동 했다 서비스 공급자, 제품 자체는 점점 더 중요 될 수 있습니다 사용자 지정 된 아키텍처와 사용자 요구에 맞게 솔루션 더 인기가 있을 수 있습니다의 지속적인 개발 클라우드 컴퓨팅 미래 건축 디자인을 쉽게 만들 것입니다, 배포 및 마이그레이션 보다 편리 하 게.
미래의 큰 데이터에 대 한 전망 거 대 한, 사람들의 삶을 수 없습니다 이제 대용량 데이터, 클라우드 컴퓨팅, 클라우드 스토리지, 전기 등에서 분리 된 사이트 데이터는 대용량 데이터 기술 개발 하지만 큰 데이터 또는 도전, 새로운 기술에 대 한 기술 개발은 지속적으로 업데이트, 그래서 큰 데이터 응용 프로그램의 문제는 새로운 기술의 조합 큰 데이터를 지속적으로 최적화 하는 알고리즘.
대용량 데이터 저장 기술, 병렬 컴퓨팅, 처리량
영감의 보호 관찰 형 장 읽은 후:
큰 데이터 시작 그냥, 좋은 기회와 도전, 개발을 깨는 것입니다 대량 채굴 데이터, 데이터 세분화 알고리즘, 분산 그래프 계산 큰 데이터의 깊이 이해 하, 많은 배울 수 있다, 기분이 급 유, 더 나은 것, 자신의 큰 데이터의 단점, 나 오, 당신을 보고 높은 비행가,가 나 걸릴 수 있습니다 희망...