New Internet:大資料採礦

來源:互聯網
上載者:User
《New Internet:大資料採礦》基本資料作者: 譚磊 [作譯者介紹]出版社:電子工業出版社ISBN:9787121196706上架時間:2013-3-8出版日期:2013 年3月開本:16開頁碼:376版次:1-1所屬分類:電腦 > 資料庫 > 資料庫儲存與管理
更多關於 》》》《New Internet:大資料採礦》內容簡介電腦書籍  《new internet:大資料採礦》全面地介紹了如何使用資料採礦技術從各種結構的(資料庫)或非結構(web)的海量資料中提取和產生業務知識。作者梳理了各種資料採礦常用演算法和資訊採集技術,系統地描述了實際應用時如何在互連網日誌分析、電子郵件營銷、互連網廣告和電子商務上進行資料採礦,著重介紹了資料採礦的原理和演算法在互連網海量資料採礦中的應用。   《new internet:大資料採礦》主要特點:全面介紹了資料採礦和大資料的基本概念和技術;大量採用了實際案例,實用性強;詳細介紹了大資料採礦領域最新的商業應用。   《new internet:大資料採礦》是從事資料採礦研究和開發,或者是互連網相關行業從事資料運營的專業人員理想的參考書,同時也可作為瞭解資料採礦應用的入門指南。目錄《new internet:大資料採礦》 第1章 緒論——從淘金客到礦山主 1 1.1 大資料時代的“四v” 2 1.2 什麼是大資料採礦 5 1.2.1 從資料分析到資料採礦 6 1.2.2 web挖掘 9 1.2.3 大資料採礦之“大” 10 1.3 大資料採礦的國內外發展 12 1.3.1 資料採礦的應用發展 12 1.3.2 資料採礦研究發展 17 1.4 本書內容 19 第2章 一小時瞭解資料採礦 23 2.1 資料採礦是如何解決問題的 23 2.1.1 尿不濕和啤酒 23 2.1.2 target和懷孕預測指數 24 2.1.3 電子商務網站流量分析 25 2.2 分類:從Face Service系統說起 27 2.2.1 分類演算法的應用 29 2.2.2 資料採礦分類技術 33 2.2.3 分類演算法的評估 37 .2.3 一切為了商業 40 2.3.1 什麼是商業智慧(business intelligence) 40 2.3.2 資料採礦的九大定律 43 2.4 資料採礦很糾結 44 2.5 資料採礦的基本流程 45 2.5.1 資料採礦的一般步驟 45 2.5.2 幾個資料採礦中常用的概念 47 2.5.3 crisp-dm 51 2.5.4 資料採礦的評估 53 2.5.5 資料採礦結果的知識表示 55 2.6 本章相關資源 59 第3章 資料倉儲——資料採礦的基石 60 3.1 存放資料的倉庫 60 3.1.1 資料倉儲的定義 61 3.1.2 資料倉儲和資料庫 63 3.2 傳統的資料倉儲介紹 64 3.3 資料倉儲基本結構 67 3.4 olap線上分析處理 69 3.5 雲端儲存上的資料倉儲 71 3.5.1 google公司的雲架構 71 3.5.2 開源的分布式系統hadoop 77 3.5.3 facebook的資料倉儲 85 3.5.4 nosql 86 3.6 本章相關資源 89 第4章 資料採礦演算法及原理 91 4.1 資料採礦中的演算法 91 4.2 資料採礦十大經典演算法 92 4.3 分類演算法(classification) 96 4.4 聚類演算法(clustering) 99 4.5 關聯演算法 102 4.5.1 關聯演算法中的概念 103 4.5.2 關聯規則資料採礦過程 105 4.5.3 關聯規則的分類 106 4.5.4 apriori演算法的執行執行個體 107 4.5.5 關聯規則挖掘演算法的研究與最佳化 108 4.6 序列挖掘(sequence mining) 113 4.7 資料採礦建模語言pmml 115 4.8 本章相關資源 117 第5章 在進行資料採礦之前 120 5.1 Data Integration 121 5.2 為何要做資料預先處理 122 5.3 資料預先處理 124 5.3.1 資料清理 124 5.3.2 資料轉換 129 5.3.3 資料規約 132 5.4 本章相關資源 134 第6章 r語言和其他資料採礦工具 136 6.1 r語言的曆史 136 6.1.1 r語言的特點 142 6.1.2 r語言和資料採礦 149 6.2 其他資料採礦工具 152 6.2.1 matlab 153 6.2.2 其他商用資料採礦工具 155 6.2.3 開來源資料挖掘工具weka 159 6.3 資料採礦和雲 160 6.4 本章相關資源 162 第7章 互連網上的日誌分析 164 7.1 網站日誌簡介 165 7.2 網站Tlog 175 7.2.1 web日誌預先處理 175 7.2.2 web日誌分析和資料採礦 181 7.3 郵件日誌 183 7.4 本章相關資源 184 第8章 資料採礦和電子郵件 186 8.1 郵件營銷與垃圾郵件過濾 186 8.2 資料採礦和郵件營銷 189 8.2.1 如何有效地進行郵件營銷 189 8.2.2 郵件營銷案例分享之一 195 8.2.3 郵件營銷案例分享之二 200 8.2.4 運用資料採礦rfm模型提高郵件營銷 效果 203 8.3 資料採礦和垃圾郵件過濾 208 8.3.1 垃圾郵件 209 8.3.2 垃圾郵件過濾技術 209 8.3.3 垃圾郵件過濾案例 215 8.4 本章相關資源 218 第9章 資料採礦和互連網廣告 219 9.1 互連網廣告 219 9.2 廣告作弊行為 223 9.3 網站聯盟廣告 225 9.4 網站聯盟廣告上的資料採礦 226 9.4.1 資料助力網盟廣告 227 9.4.2 如何應對網盟廣告作弊 236 9.5 本章相關資源 241 第10章 資料採礦和電子商務 242 10.1 中國電子商務現狀 242 10.2 在互連網上賣米 248 10.3 用資料來掌握客戶 250 10.3.1 客戶何時來,從哪來 253 10.3.2 客戶最喜歡哪種商品 257 10.3.3 競爭與反競爭分析 260 10.3.4 客戶還會買什麼 261 10.3.5 哪些客戶是我們需要的 264 10.4 電子商務案例 265 10.4.1 電子商務企業案例一 266 10.4.2 電子商務企業案例二 279 10.5 本章相關資源 286 第11章 資料採礦和web挖掘 288 11.1 互連網上的個人化–like 289 11.1.1 like=像 289 11.1.2 like=喜歡 290 11.2 web挖掘和sns 295 11.2.1 sns上的資料價值 295 11.2.2 sns上的資料關聯關係 297 11.2.3 sns上的使用者關係 299 11.3 資料採礦和隱私 302 11.4 本章相關資源 307 第12章 資料採礦和移動互連網 308 12.1 移動互連網的特殊性 308 12.1.1 鎖定使用者的資料價值 309 12.1.2 移動互連網上資料的形式 310 12.1.3 移動互連網地理位置資訊的價值 312 12.2 資料採礦和lbs 314 12.2.1 用pu學習演算法做文本挖掘 315 12.2.2 用相似匹配演算法做地點挖掘 318 12.3 移動互連網資料面臨的問題 320 12.4 本章相關資源 322 附錄a 技術詞彙表 323 附錄b 英語參考文獻表 335 附錄c 中文參考文獻表 347 附錄d 微博 350 附錄e 部落格和其他網址 351 本圖書資訊來源:中國互動出版網
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.