큰 데이터의 진짜 얼굴은 무엇입니까?

출처: 인터넷
작성자: 사용자
키워드: 큰 데이터 제품 작업 날카로운 칼 룽

이 시대에서는, 낱말 "빅 데이터", "클라우드 스토리지"와 "클라우드 컴퓨팅"은 절대적으로 비전과 혼합된 인터넷의 그룹에서 청력의 첫 번째 기술 또는 제품 또는 작업 또는 비즈니스. 하지만 큰 데이터 입니까? 큰 데이터를 무엇입니까? 이게 뭐예요? 그것은 멋진 본다.

사실, 큰 데이터 iffy 기술, 하지만 일반적인 기술, 데이터에서 값을 검색 하는 기술 하지 않습니다.

I. 대용량 데이터에 대 한 4 가지 오해

1. 많은 수의 오류는 데이터

"Everbright 아니다 이젠 그만!" 내가이 문장으로 시작, 여자는 문을 밀고로,이 문장, 약간 yizheng 들어, 숙이 고 앉.

많은 경우, 대용량 데이터의 언급의 기본 "데이터 볼륨 XXGB, 업로드 사진 xxgb, XXX의 동시 수 처리의 날"을 말할 것 이다 지금 "Hadoop 클러스터는 XXXX 노드, 총 스토리지 Xxpb"... 이러한 기술 언어입니다. 하지만 데이터가 아니라 큰, 큰 데이터의 영역에 도달할 수 있는, 생활의 훌륭한 조화를 함께 얻을 수 있습니다?

다시 큰 데이터 사용 하지, 그건 큰 데이터, 하지만 검은 양 룸 Pianan 코너에 있어. 이 문제에 전통적인 포털 사이트는 기본적으로 구성원 매춘에 돈도 있지만 황금 언덕에 앉아 있습니다. Sohu Sina NetEase, 더 많은 가치를 생산 하기 위해 하루 수백 수백만, 하지만 이외에 간단한 광고 프레 젠 테이 션, 그리고 데이터의 분석을 통해 하지 사용자 수에. 이유는 펭귄을 언급 하지 않기 위하여, 그들은 가장 큰 QQ 사용자, 홍보 하지 않았다 하지만 대표 하지 않는다 때문에 하지 않았다, 놀라운 감정의 종류의 QQ 서클의 소개 등, 지금 그것의 또한 생각 충격.

그리고 작고 중소 웹 사이트에 대 한 맹목적 추구 하지 구조의 고급 기술. 고려해 야 할 첫 번째 것이입니다 비즈니스 운영 및 홍보, 사용자 지 빨강의 경우는 다음 기술 업그레이드를 고려 하는 경우에. 당신에 게 이중 선택, a. 1000 사용자, 미국 아마존 전체 참조의 프레임 워크 절대 가동 중지 시간, 높은 동시성 인해 B. 매일 사용자 100000 명, 세 번이 서 있다. 당신은 무엇을 선택할 것 이라고?

당신은 생각 하지 않는, "내 사이트는 너무 많이 너무 열정적인 사용자 때문에 아래로?"

2. 오해 2 큰 데이터 기술을 이해합니다 해야 이해

"기술을 모르는, 큰 데이터 배울 수 있습니까"?

큰 데이터의 끝 없는 데이터에서 비즈니스 기회의 값을 표시 하는 능력, 아니라 기술, 더 많은입니다. 제갈량 이해 전쟁의 아트, 그가 어디 매 복을 점화 한다, 그는 Guan 유 날이 넓은 칼, 재생 하는 방법을 알아야 필요 하지 않습니다도 그것은 장 Fei 뱀 창 끊기거나 잘라 여부를 알고 필요가 없습니다.

3. 큰 데이터를 이해 해야 합니다 모든 3 명의 회사를 오해

그 아줌마 팬 케 익 과일을 판매 하는 애플 리 케이 션을 개발할 수 있습니다 받을 고객 팬케이크 인지 선명 하지 인정, 칠리 소스 flavoursome 직접 의견, 제품 향상에 유리 하다. 하지만 3 달러 팬케이크에 대 한 8 M 응용 프로그램을 다운로드할 것 이다?

그리고 모바일 인터넷 컨퍼런스, Evernote의 CEO 인 필 리빈, 분명히 했다 그의 제품에 대 한 비즈니스 모델 큰 현재 데이터로 재생 하는 것 보다는 제품 경험에 대 한 지불 지 사용자를 충전 했다.

그것은 그래서 당신이 무엇을 재생할 수 있습니다 알고 일반적 이며 재생 없이 재생할 수 없습니다 알아야 더 귀중 한.

4. 오해 4 데이터 더 나은

에디슨 첸 Li Zongrui에서 모든 중독의 두꺼운 컬렉션을 공개 했다. 하드 드라이브의 깊이에 숨겨진 그 여자 정말 있나요 일광 볼 일? 여부 도쿄 핫 또는 카리브해, 출처만 새로운 아시아 요리, 오래 된 사람에 게 수신에와 서 구입?

그리고 "50 년 전 13 백만"에서 핵심 단어는 "보증금 감가 상각" 검색, "10000 원"19 원 보상 1 년 저장을 볼 수 있습니다, 돈 값 하는 데 사용 해야 합니다, 그리고 데이터는 동일.

데이터 마이닝 데이터 관계 및 값 뒤에 일정 한 사용만 일반, 눈덩이 같은 수 있도록 풍부 하 고 더 완벽 한 데이터 간의 관계.

2. 대용량 데이터의 핵심 아이디어

1. 어떤 중요 하지 않습니다?

회의 찾을 무기력에서 남자와 여자, 활공, 능력을 이해 하 공공 및 편 파 제품의 기술적인 측면 사이의 경우, 다음은 때마다 얼굴 졸린 냉담 한. (당신이! 당신은 여기 섹스 이야기를 듣고 있습니까?

자기 이야기 "카드놀이"를 큰 데이터를 사용 하 여 넷 플 릭 스의 헤아릴 수 없는 시간 들 었 되었습니다. 넷 플 릭 스 미국에서 가장 큰 DVD와 인터넷 비디오 대 여 사이트입니다, 국가에 27 백만 사용자와 33 백만 세계적으로. 그들은 스트리밍 비디오 사용자 로부터 수집 하는 데이터는 의외로 놀라운, 모든 검색, 모든 일시 중지, 모든 긍정적인 또는 부정적인 평가 및 자체 위치 데이터 장치 데이터 소셜 미디어 데이터를이 데이터를 분석 후 배우 케빈-시-서쪽, 같은 그들의 관객 발견 또한 감독 데이비드 핀치, 좋아하고 영국 TV 시리즈의 1990 년 처럼. 함께, 넷 플 릭 스는 카드 하우스를 촬영 하 여 최대한의 데이터 분석을 사용 하 여 결정 됩니다. 넷 플 릭 스의 보기 페이지에서 일시 중지 된 스크린샷 기능을 제공 하 고 그들은 관객에서 선호 하는 장면과 그림의 어떤 종류를 확인 하기 위해 데이터에 의존.

물론,이 세 가지 요소는 사실 안정, 예를 들어 케빈 Spacey만 4.2 포인트의 "프레드 산타 클로스" 했다, 데이비드 핀치의 처음 지시 "외국인 3" 시리즈에서 최악 이기도. 하지만 확률의 측면에서 이러한 세 가지 성공 요인 보다 안정적인 에피소드 포함.

또한, "이름" 응용 프로그램의 데이터 뒤에 정체성의 유용 하지만 더 인위적인 될 것으로 보인다 비록 사용할 수 있습니다 다양 한 2 번. 비슷한 응용 프로그램을 볼 때마다 항상 전 동료 넣어 "스위스,"를 입력, 이제만이 응용 프로그램은 국가 1, 스위스에서 찾을 정확 이국적인 이름에서에서 및 안후이 사람들. 스위스 대사관 전화 하 고 신속 하 게 가둬!

그래서 큰 데이터의 핵심 데이터, 하지만 데이터 하지 않습니다. 즉, 그냥 다른 사람의 신체를 차지할 수 없지만 또한 다른 사람의 마음을 차지 합니다.

2. 더 많은 결함 허용 데이터와 더 다양 한 소스

500 M 사용자 데이터 Excel 테이블은 큰 데이터? 화가 났 었는 제품의 사용자 심사에 같은 Excel 성공적으로 끌고 내 컴퓨터 세 번, 한 번 말했다: "KAO, SB 큰 데이터가!" 지금 생각, 내가 잘못 한 큰 데이터 신사, 고통.

진짜 큰 데이터를 다른 차원에서 해야 데이터 조각화, 등등 텍스트/비디오/음성/위치/사진에 국한 되지 않음의 다양 한 형식을 통해 서 다른 방법. 다른 크기의 데이터를 함께 퍼 팅에 의해서만 추세 수 더 현실. 때 동일한 데이터를 특정 제한 보다 더 많은 누적, 우리 덜 유용한 정보에서에서 얻을 새로운 샘플 처럼 경제학에 한계 효과 점감 하 고 있다. 그리고 당신이 이미 하는 일자이 있다 그것은 야드, 5 여섯 번째 한 새로운 어디로 가야할 지, 그것은 더 나은 방향으로 재조정 됩니다 경우 몇 가지 다른 자극을 찾을 수 Gaofu 변경 간단한 설명입니다.

다양성의 소스도 막다른 골목에 갇혀 되 고 피 한다. 예를 들어 "3 년 자연 재해"만 3 년 기상 조건 및 죽음의 수의 관계를 확인 하는 경우. 다음 그것은 결론 수 있습니다는 "맑은 날씨는 흐린 날 보다는 죽음을 일으킬 가능성이 더." 하지만 사실, 결합 하는 "사람들의 일상" 적절 하 고 공정한 보고서, 중국 음식의 그 년의 무 당 100000 kg 수입 및 수출, 그럼 우리가 더 건설적인 결론에 올 것 이다. 동생의 후 190에서 심문, 단지 4 개의 숫자를 말했다. 1958 년에, 중국 식품의 2.8834 백만 톤을 수출 하 고 223,500 톤 수입. 어려운 시기, 1959 년의 첫 해에서 중국 수출 4.1575 백만 톤, 수입 2000 톤, 그 해, 모두는 매우 배가 들 었. 차를 마시는 하지 않도록, 말하지 마.

예를 들어 두 일 Taobao 섹스 상품 이외에 맞춤된 광고를 밀어 내게는 "플레이보이" 의상 큰 할인, 자료 찾고 하지 고 지도 "섹스 상품"에 대 한 검색 Mody? 당신이 있어 밀어 왔다이 나를 위해 영원히. 초등학교 선생님의 의견을 얻을 수 있는 경우 중학교 선생님의 의견을 학교 수행 평가, 고등학교 선생님의 의견과 행동 평가, 다양 한 다른 데이터 소스 분석의 소스를 통해 그리고 푸시 될 것입니다 당신은 내게 "어떻게 철 및 강철" "Lei Feng 일기"와 다른 좋은 책 들. 경우에도 대학 선생님의 코멘트, CS는에 의해 찢 겨 나 너무 긴 싸움 원한을 쉽습니다. )

3. 대용량 데이터 뿐만 아니라 대용량 데이터의 몸

이전 데이터 분석, 데이터 마이닝, "정밀"의 대명사가 더 정확한 샘플/깊이. 마십시오 하지, 샘플 필터의 사양을 다음 PPT, 할 몇 정확 하 고 비교할 수 없는 수치를 얻으려면 데이터 필드 사이의 관계에 깊이 파고 또는 데이터의 시리즈에서 정확 하 게 더러운 솔직 한 여자의 얼굴을 찾을.

하지만 큰 데이터도 정확 하 게 없다, 데이터 분석에서 추세의 어떤 종류에 대 한 더 많은 하지만 그것은 의사 결정자 결정에 영향력을 준다. 큰 데이터는 중요 하지 않습니다, 그것은 큰 데이터를 사용 하는 사람들.

때문에 정확한 동일한 데이터 원본에 대 한 결론 또는 다른 사람들의 결정은 매우 달라질 수 있습니다. 3 개의 왕국 드려 전쟁 때 제안 격 통 "보트 모든 일치 하는 경우 또는 행, 30 또는 50 행, 농구 대, 체인의 끝에 대 한 확산 넓은 보드 휴 말했다 사람들 교차 될 수 있다는 말에, 갈 수 및 좌석 아래 Caocao와 시,"하지 씨 좋은 추구, 앤 이스트 Wuye을 깰 수 있다!", 두 사람의 말을 듣고 동시에 그리고 개인 격 통에 쑤 슈 "당신은 대담 하 고, 레코딩의 두려워 이다." "을 보여주는" 사람-지향 "은 어떻게 예리한 말도 아!

당신 NB 이나 SB, 데이터 인지 항상 거기, 절대 포기.

4. 트렌드와 미래를 강조

큰 데이터를 더 분석은 과거의 일, 지금, 미래를 찾고 생각나 게 한다. 연습에서 사용할 수 없는 큰 데이터를 왕 따,이 결과 모든 인류, 또는 도움에 도움이 웹사이트 1%의 전환율을 증가, 이것은 유용 하다.

위의 사진은, 폭력은 냉전 시대 미국과 소련에 의해 개발 된 고속 열차 그리고 그들은 기차 위에 직접 터보 폭격기를 넣어. M-497, 미국, 1966 년에 오하이오 트랙에 295.54 km/h를 달렸다. 비록 몇 십년 후, 현대 고속 철도, 하지만 초기 야만 적 실험 없이 나 고속 레일의 독립적인 개발 너무 강한 되지 않습니다 무서 워 요.

큰 데이터의 추세에 대 한 이야기, 어떻게 Google 독감 트렌드를 언급 하지 수? 구글 분석 검색어의 수백만의 수백 자신의 거의 실시간으로 인플루엔자 전염병 평가 screenshot에서 볼 수 있습니다, 세계의 많은 지역과 국가 제공 하기 위해 Google의 추세 곡선 및 미국 공식 데이터 중복 매우 높습니다, 하지만 시간과 효율에 후자는 구글 트렌드에와 일치 수 있습니다.

비즈니스 여행 거 야 그리고 당신은 전염병 곳 분화는 발견, 난 대부분의 사람들이 것 이다 울 종료 소리.

2012 년, 캠퍼스 성적 상태 보고서를 발행 하는 미국에서 유명한 콘돔 브랜드 예를 들어 미국에서 대학생의 25%가 성병, 번호 하나는 콘 acuminatum, 학교의 가장 높은 질병 율 보고서 쇼 콜로라도 주, 미국 공군 사관학교 (미국 공기 힘에 있는 그런 다음, 그 후 학교 소년 차지 78.1%, 21.9%를 차지 하는 여자 보고 대학 공식 웹사이트에서 지 루 했다.

이 데이터에서 적어도 우리가 결과 분석할 수 있습니다: 한 한 밤 귀환에와 함께, 전에 카드를 확인 하시기 바랍니다.

3. 대용량 데이터 응용 프로그램 장 님 생각

1. 의료 서비스

의료 기록 및 기타 데이터, 사람들의 건강 트렌드의 특정 종류의 시리즈를 통해 "IT8 년 할" "하루 6 시간 초과" 같은 "질병 또한 주장 작업" "점심을 먹고 매일" "연기 매일 팩" 위와 같이 "매일 커피를 상쾌의 컵" 레이블 맞춤 다음 사람의 그룹에 특정 정보의 조각을 밀어.

시간 외에 작동 하는 다른 사람?

2. 범죄 경고

역사적 범죄와 도시의 경찰 기록를 통해 우리는 빨리 손을 지역/발굴 지역/성적 폭행 지역 등 도시에서 높은 범죄의 많은 분야는 결론 수... 고, 미리 알림 해제를 매일 밀어 공용 휴대 전화/평면 및 다른 터미널. 내가 성폭행 영역에서 악성 압도 하 고 항복 것 이라고 믿습니다.

3. 이전 청소년 팅

이 아이디어와 Google 유리 착용 장비와 비슷한 남자의 수백에서 더욱 고 여성 회의 데이트, 여자, 시스템 갖춘 안경 둘러 함께 자동으로 다양 한 데이터, 나머지 절반의 대부분 배치를 찾는 데 도움이 분석 일치 정도 따라 자동으로 도보 함께. 물론, 적외선 관점은 매우 개발 하는 경우 그것은 대단할 것 이다 가장 일치 정도 누드를 보고 지불 하는 VIP 함수에 추가.

4. 요약

심지어 속 특유의 대형 데이터 항목, 곧 역을 다시 1 시간을 동축 케이블, 연수생 소년 다음과 같은 메시지를 보냈습니다.

"선생님, 큰 데이터 공유에 들어, 내가 그렇게 이해할 수 있다?" 빅 데이터는 거 시기에 따라 시스템의 시대/높이/무게/드레싱 스타일/쇼핑 성향 및 기타 기본 정보 플러스는 영화/배우/스타일/기간/앞 번의 주파수에 이전 모습 하 고 포괄적인 참조 나 동일한 수 탉 실크 그룹 여신/재생 포맷 /area 및 다른 요인, 나는 컴퓨터를 켤 때 자동으로 저에 게 가장 적합 한 추천에 대 한 내 영화?

내가이 구절을 읽고 오랜 시간 수 없는 진정. 하나의 노래는 순간 내 분위기를 표현할 수 있습니다.

"아 ~ ~ ~ 얼마나 고통 스러운 이해!"

관련 문서

연락처

이 페이지의 내용은 인터넷에서 가져온 것이므로 Alibaba Cloud의 공식 의견이 아닙니다.이 페이지에서 언급 된 제품 및 서비스는 Alibaba Cloud와는 관련이 없으므로이 페이지의 내용이 골칫거리 인 경우 저희에게 알려주십시오. 우리는 5 일 근무일 이내에 이메일을 처리 할 것입니다.

커뮤니티에서 표절 사례를 발견한 경우 info-contact@alibabacloud.com 으로 관련 증거를 첨부하여 이메일을 보내주시기 바랍니다. 당사 직원이 영업일 기준 5일 내에 연락 드리도록 하겠습니다.

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.