MATLAB資料分析與挖掘實戰,matlab資料分析實戰

來源:互聯網
上載者:User

MATLAB資料分析與挖掘實戰,matlab資料分析實戰
這篇是電腦中資料庫儲存與管理類的優質預售推薦《MATLAB資料分析與挖掘實戰》。
多位資深資料採礦專家10餘年實戰經驗結晶,深入講解資料採礦各個環節的各項技術。

編輯精選通過10餘個真實的案例為10餘個行業的資料採礦提供瞭解決方案,並提供相關的建模檔案和原始碼。

前言部分   為什麼要寫這本書
  LinkedIn 對全球超過3.3億使用者的工作經曆和技能進行分析後得出,在目前最炙手可熱的25項技能中,資料採礦人才需求排名第一。那麼資料採礦是什嗎?
  資料採礦是從大量資料(包括文本)中挖掘出隱含的、先前未知的、對決策有潛在價值的關係、模式和趨勢,並用這些知識和規則建立用於決策支援的模型,以及提供預測性決策支援的方法、工具和過程。資料採礦有助於企業發現業務的趨勢,揭示已知的事實,預測未知的結果,因此“資料採礦”已成為企業保持競爭力的必要方法。 
  但和國外相比,我國由於資訊化程度不太高,企業內部資訊不完整,所以零售業、銀行、保險、證券等行業對資料採礦的應用並不太理想。但隨著市場競爭的加劇,各行業對資料採礦技術的意願越來越強烈,可以預計,未來幾年,各行業的資料分析應用一定會從傳統的統計分析發展到大規模的資料採礦應用。在大資料時代,資料過剩、人才短缺,資料採礦專業人才的培養又需要專業知識和職業經驗的積累。所以,本書注重資料採礦理論與項目案例實踐相結合,可以讓讀者獲得真實的資料採礦學習與實踐環境,更快、更好地學習資料採礦知識與積累職業經驗。
  總的來說,隨著雲時代的來臨,大資料技術將具有越來越重要的戰略意義。大資料已經滲透到每一個行業和業務職能領域,逐漸成為重要的生產要素,人們對于海量資料的運用預示著新一輪生產率增長和消費者激增浪潮的到來。大資料分析技術將協助企業使用者在合理的時間內攫取、管理、處理、整理海量資料,也為企業經營決策提供積極的協助;大資料分析作為資料存放區和挖掘分析的前沿技術,廣泛應用於物聯網、雲端運算、移動互連網等戰略性的新興產業。雖然大資料目前在國內還處於初級階段,但是其商業價值已經顯現出來,特別是有實踐經驗的大資料分析人才更是各企業爭奪的熱門。為了滿足日益增長的大資料分析人才的需求,很多大學開始嘗試開設不同程度的大資料分析課程。“大資料分析”作為大資料時代的核心技術,必將成為高校數學與統計學專業的重要課程之一。
  本書特色
  本書作者從實踐出發,結合大量資料採礦工程案例及教學經驗,以真實案例為主線,深入淺出地介紹資料採礦建模過程中的有關任務:資料探索、資料預先處理、分類與預測、群集、時序預測、關聯規則挖掘、智能推薦、偏差檢測等。因此,本書的編排以解決某個應用的挖掘目標為前提,先介紹案例背景並提出挖掘目標,再闡述分析方法與過程,最後完成模型構建,在介紹建模的過程中穿插操作訓練,把相關的知識點嵌入相應的操作過程中。為方便讀者輕鬆地擷取一個真實的實驗環境,本書使用大家熟知的MATLAB工具對樣本資料進行處理以進行挖掘建模。
  為了便於讀者對案例的理解,本書提供了真實的原始樣本資料檔案及資料探索、資料預先處理、模型構建及評價等不同階段的MATLAB代碼程式,讀者可以從全國大學生資料採礦競賽網站(http://www.tipdm.org/ts/578.jhtml)免費下載。另外,為滿足教師授課的需要,本書還特意提供了建模階段的過程資料檔案、PPT課件,以及基於MATLAB、SAS EM、SPSS Modeler、R、TipDM等上機實驗環境下的資料採礦各階段程式/模型及相關代碼,讀者可通過熱線電話(40068-40020)、企業QQ(4006840020)或以下公眾號TipDM(或號Tip DataMining)諮詢擷取,同時也可通過上述連絡方式諮詢本書的相關問題。
  本書適用對象
  開設資料採礦課程的高校教師和學生。
  目前國內不少高校將資料採礦引入本科教學中,在數學、電腦、自動化、電子資訊、金融等專業開設了與資料採礦技術相關的課程,但目前這一課程的教學仍然主要限於理論介紹。因為單純的理論教學過於抽象,學生理解起來往往比較困難,教學效果也不甚理想。本書提供的基於實戰案例和建模實踐的教學,能夠使師生充分發揮互動性和創造性,理論聯絡實際,達到最佳的教學效果。
  需求分析及系統設計人員。
  這類人員可以在理解資料採礦原理及建模過程的基礎上,結合資料採礦案例完成精確營銷、客戶分群、交叉銷售、流失分析、客戶信用記分、欺詐發現、智能推薦等資料採礦應用的需求分析和設計。
  資料採礦開發人員。
  這類人員可以在理解資料採礦應用需求和設計方案的基礎上,結合本書提供的第三方介面快速完成資料採礦應用的編程實現。
  進行資料採礦應用研究的科研人員。
  許多科研院所為了更好地對科研工作進行管理,紛紛開發了適用自身的科研業務管理系統,並在使用過程中積累了大量的科研資訊資料。但是,這些科研業務管理系統一般沒有對這些資料進行深入分析,並沒有對資料所隱藏的價值充分地挖掘利用。科研人員需要通過資料採礦建模工具及有關方法論來深挖科研資訊的價值,從而提高科研水平。關注進階資料分析的人員。
  業務報告和商業智慧解決方案對於瞭解過去和現在的狀況可能是非常有用的。但是,資料採礦的預測性分析解決方案還能使這類人員預見未來的發展狀況,讓他們的機構能夠先發制人,而不是處於被動。因為資料採礦的預測性分析解決方案將複雜的統計方法和機器學習技術應用到資料中, 通過使用預測性分析技術來揭示隱藏在交易系統或企業資源計劃(ERP)、結構資料庫與普通檔案中的模式和趨勢,從而為其決策提供科學依據。
  如何閱讀本書
  本書共16章,分三篇:基礎篇、實戰篇和提高篇。基礎篇介紹了資料採礦的基本原理;實戰篇介紹了各種真實案例,通過對案例深入淺出的剖析,使讀者在不知不覺中獲得資料採礦項目的經驗,同時快速領悟看似難懂的資料採礦理論。讀者在閱讀過程中,應充分利用隨書配套的案例建模資料,藉助相關的資料採礦建模工具,通過上機實驗,以快速理解相關的知識與理論。
.  基礎篇(第1~5章),第1章的主要內容是資料採礦基礎;第2章對本書所用到的資料採礦建模工具MATLAB進行了簡明扼要的說明;第3~5章介紹資料採礦的建模過程,包括資料探索、資料預先處理及挖掘建模的常用演算法與原理。
  實戰篇(第6~15章),重點對資料採礦技術在電力、航空、醫學、互連網、生產製造以及公用服務等行業的應用進行了分析。在案例結構組織上,本書是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最後完成模型構建的順序進行的,在建模過程的關鍵環節,穿插程式以實現代碼。最後通過上機實踐,加深資料採礦技術在案例應用中的理解。
  提高篇(第16章),介紹了基於MATLAB二次開發的資料採礦應用軟體——TipDM資料採礦建模工具,並以此工具為例詳細介紹了基於MATLAB介面完成資料採礦二次開發的各個步驟,使讀者體驗到通過MATLAB實現資料採礦二次開發的強大魅力。
  勘誤和支援
  除封面署名外,參加本書編寫工作的還有樊哲、雲偉標、王路、徐英剛、薑雅君、廖曉霞、李白冰、劉名軍、劉曉勇、薛雲、胡曉輝、李成華、劉麗君、許寶通、黃輝煌、王雲飛等,由於作者水平有限,編寫時間倉促,書中難免會出現一些錯誤或者不準確的地方,懇請讀者批評指正。
  讀者可以將書中的錯誤及遇到的問題通過前面提供的公眾號或QQ號反饋給我們,我們將盡量線上上為讀者提供最滿意的解答。本書的全部建模資料檔案及來源程式,可以從全國大學生資料採礦競賽網站(www.tipdm.org)下載,同時我們將會及時發布相應內容的更新。如果您有更多的寶貴意見,歡迎發送郵件至郵箱13560356095@qq.com,期待能夠得到您的真摯反饋。
  致謝
  在本書編寫過程中,得到了廣大企事業單位科研人員的大力支援,在此謹向廣東電力科學研究院、廣西電力科學研究院、廣東電信規劃設計院、珠江/黃海水產研究所、輕工業環境保護研究所、華南師範大學、廣東工業大學、廣東技術師範學院、南京中醫藥大學、華南理工大學、湖南師範大學、韓山師範學院、廣東石油化工學院、中山大學、廣州泰迪智能科技有限公司、武漢泰迪智慧科技有限公司等單位給予支援的專家及師生致以深深的謝意。
  在本書的編輯和出版過程中還得到了參與中國資料採礦建模競賽(http://www.tipdm.org)的眾多師生及機械工業出版社楊福川和薑影等人的無私協助與支援,在此一併表示感謝。
  張良均
窩們網站預售的該本書,購買傳送門點擊開啟連結


相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.