큰 데이터 quweicunzhen의 진정한 가치
큰 데이터 산업 개발 속도 놀라운 큰 데이터 분석 기업에 대 한 거 대 한 값을 가져왔다, 기업 결정 새로운 보조 되고있다. 중국에는 오래 된 말 이지만 "아니 책 만큼 편지", 사실, 대용량 데이터 분석 생각 만큼 완벽 하지 않습니다. 이것은 주로 하기 때문에 큰 데이터는 사용자의 가치에 모든 데이터, 일부 스팸도 깊은 해가지고 데이터 값, 데이터를 필터링 하는 방법을 수집, Quweicunzhen, 대용량 데이터의 진정한 가치에 키 이다.
쓰레기 정보는 무엇입니까?
스팸 메일은 무엇입니까 즉, 많은 유용한 정보, 유해 정보, 및 큰 데이터 분석의 결과 영향을 주는 정보에 혼합 쓸모 없는 정보입니다.
하지만 스팸 메일은 절대, 사용자 A에 게 쓸모가 있을 수 있습니다, 그것은 아무 분석의 결과에 해로운 하지만 사용자 B에 대 한 유용한 정보를 수 있습니다. 따라서, 같은 업계의 사용자가 정크 정보, 쓸모 없는 정보에 그들의 자신의 데이터를 구별 배워야 한다.
일반적인 정크 정보:
우리의 일상 생활에서 모든 종류의 쓰레기 정보 어디에 나 있을 라고 할 수 있습니다. 예를 들어 네트워크에는 네트워크 해군의 많은,이 사람들이 많은 정크 정보 생산, 대용량 데이터 분석의 결과 나쁜 영향을. "X 잔치"의 마지막 릴리스에서 선전 파티 높은 점수 결과로 많은 포인트 브러쉬 해군 고용 하지만 나쁜 평판 보기 후 마침내 주최자 진정 사과 하. 이러한 네트워크 해군의 데이터는 쓰레기 정보입니다.
네트워크 해군 (선양 시에서 사진)
물론, 비슷한 사례의 많은 Taobao 열 몇 년 전, 판매자 브러시 드릴링의 수준은 매우 높은 드릴링 공구, 많은 상점의 이러한 결과 대 한 특별 있다 하지만 제품 및 판매 후 서비스는. Weibo 사용자 브러쉬 파우더는 한 동안, 네트워크의 많은 유행; 전기 상거래 웹사이트 프로 모션 기간 브러시 무역 단 수 큰 V 진짜 팬 들은 몇 가지 포럼 브러시 응답 붙여넣기, 포럼 매우 화재 상황을 만듭니다. 그리고, 이러한 스팸 메시지 데이터의 값을 손상 깊이.
대용량 데이터 시장 현재 상황:
아무 부정 하는 큰 데이터는 큰 가치, 존재 하는 상황에서 큰 데이터는 거울에 물에 달 처럼, 마치 아름 다운, 하지만 그것은 과장입니다. 데이터를 사용자 데이터 센터의 무수 한에 게 귀중 한 발견은 덤프에 보물 따기 처럼 사막에서 보석을 찾고 처럼.
당신이 어떻게 데이터 센터의 많은 수에서 유용한 정보를 얻을 합니까? 하자 사람들이 정크 정보의 제거는 어떻게 봐 하 고 데이터 값을 오늘 찾고.
데이터에서 쓰레기 정보를 제거 하는 방법
스팸 정보 데이터에서의 역할을 제거?
왜 당신은이 쓰레기를 제거 하 시겠습니까? 우리가이 문서 앞부분에서 언급 한 것 들 중 하나는 쓰레기 정보 데이터 분석의 결과 영향을 하 고 데이터 값을, 어려운 그냥 스팸의 위험입니다. 같은 시간에 너무 많은 쓰레기 정보 고객 인프라의 병목을 발생, 시스템에 부담을가지고 고 스토리지, 호스트 및 다른 장비, 비용 추가 되며 크게 기업 사용자의 유지 보수 작업의 비용 증가. 어떻게 당신이이 모든 정크 정보 제거 합니까?
엔터프라이즈 스토리지 아키텍처
어떻게 합니까 내가 없애 쓰레기 정보 내 데이터에?
큰 데이터 및 기존 데이터 간의 중요 한 차이점은 전통적인 규칙 및 정크 정보를 삭제 하는 매개 변수는 덜 유용 하 게 구조화 되지 않은 데이터의 모양을. 대용량 데이터 시대에 스팸 정보를 제거 하는 새로운 방법 필요 합니다. 하지만 이제는 큰 데이터 개발 되 고, 주요 IT 업체 들은 큰 데이터 솔루션을 시작 경주는 스팸 메일을 제거 하는 몇 가지.
저자는 다음 두 가지 측면으로 시작 하는 것이 좋습니다 생각:
인력: 대용량 데이터 분석의 오늘날의 부족 수 있습니다만, 너무 많은 솔루션 수 없습니다 정말 지능형 분석을 인공 지능 부분 지지 않습니다. 문제에 솔루션을 제공 하는 관련 대용량 데이터 분석 전문가 및 일부 데이터 분석 문제는 문제에 대 한 책임 위원에 전송 됩니다.
큰 데이터 재능의 부족
하지만 오늘, 거기에 큰 데이터 분석에 대 한 전문가의 부족. 2018, 여 맥킨 지 조사에 따르면 미국 시장 전문가의 거의 200000 심층 데이터 분석, 1.5 백만 전문 관리자의 작업 간격의 데이터 해석 될 수 있습니다. 전문가 뿐만 아니라 수학적 지식 축적의 많은 년 하지만 필요 또한 프로그래밍, 비즈니스 지식 및 다른 포괄적인 기능, 대용량 데이터 부족 복합 인재 이며, 기업의 고용에 대 한 그것은 어려운 그런 재능에 대 한 적합 한 적당 한 위치.
그것은 공급 업체: 인력에 강도 증가 뿐만 아니라 전문 인력 교육. 더 큰 데이터 공급 업체, 영리 솔루션을 제공 하는 데 필요한 그리고 인력 명확 하 게 충분 하지 않습니다.
나중에 같은 쓰레기의 큰 더미에 직면,이 큰 데이터 제조 업체에 대 한 중요 한 도전 됩니다. 제조 업체 더 깊이 있는 분석 데이터를 지능적으로 데이터, 중복의 자동 제거, 동일한 IP 주소 또는 크게 데이터 분석의 속도 가속화할 것 이다 악성 간섭 데이터 수준을 식별 하는 능력의 사용자를 위해 새로운 데이터 기준을 확립 해야 합니다. 처음부터 가끔 있을 수 있습니다 조금 비트, 다음 점차적으로 축적 하는 시간이 좀 필요, 이것이 큰 데이터 제조업체 장기 테스트.
그래서 그것은 모든 권리를 큰 데이터?
데이터 quweicunzhen 데이터의 효율성을 향상 하지만 데이터의 적시성에 또한 주의 하는, 데이터의 적시성 또한 큰 데이터 분석의 결과 결정 합니다. 우리는 오래 된 것 들이 우리가 우리의 결정에 미치는 영향 분석 하지 않는 데이터의 적시성을 확인 하려면 다른 필요에 따라 해야 합니다.
적시성에 대 한 관심 필요한 대용량 데이터 분석
예를 들어 투자 산업에 대 한이 적시성이 중요, 투자 업계 신속한 분석 결과, 분석 결과 빨리, 사용자 혜택의 큰 반대에도 수 수 하는 시장 데이터를 기반으로 할 필요가 발생할 자금의 손실.
사람 중심 큰 데이터를 주로 보충 합니다.
대용량 데이터 분석 가장 귀중 한 정보를 우리에 게 제공할 수 있다, 우리 회사의 발전에 가장 유리한 출시를 도울 수 있다. 하지만 대용량 데이터 분석에 전적으로 의존 하는 사용자를 위해 가능 하지 않습니다. 모든 후, 우리는 분석 하는 데이터는 이미 일어나 고, 대용량 데이터 분석 결과 수만 제공 기준, 하지만 전 변화에 백만 꽃 시장, 또한 필요가 기민한 의사 결정자, 대용량 데이터, 마지막에 의존, 기업의 개발을 결정.
대용량 데이터 분석은 하나님, 우리를 제공할 수 있습니다만 참조가 있는 도와 우리의 미래 예측의 법률의 과거 발생을 분석 하지만 오늘날의 대용량 데이터 분석은 여전히 하지 지능형, 많은 요인 대용량 데이터 분석 계정에 반영 되지 않을 수 있습니다. 예를 들어 노키아와 모토로라 단말기 시장 지배, 우리가 수집 하는 정보는 두 브랜드에 대 한 모든 하지만 누가 안 드 로이드 폰 및 아이폰의 상승 속도 예측할 수 있는.
정리해 보면, 엔터프라이즈에서 기업 의사 결정에 큰 데이터 재생 마지막 의사 결정자 보다는 오히려 지원 역할에 더 많은입니다. 큰 데이터에 데이터 모든 포괄 이며 단순 데이터 분석의 가장 유리한 결과 하지 않습니다. 치열 한 시장 경쟁에서 큰 데이터 분석 더 중요 하 게 될 것입니다 하지만 그것은 여전히 인간의 도우미입니다.