(原創)大資料時代:基於微軟案例資料庫資料採礦知識點總結(Microsoft 群集演算法)

來源:互聯網
上載者:User

標籤:blog   http   os   使用   ar   strong   資料   sp   2014   

本篇文章主要是繼續上一篇Microsoft決策樹分析演算法後,採用另外一種分析演算法對目標顧客群體的挖掘,同樣的利用微軟案例資料進行簡要總結。

應用情境介紹

通過上一篇中我們採用Microsoft決策樹分析演算法對已經發生購買行為的訂單中的客戶屬性進行了分析,可以得到幾點重要的資訊,這裡做個總結:

1、對於影響購買單車行為最重要的因素為:家中是否有小汽車,其次是年齡,再次是地區

2、通過摺疊樹對於比較想買單車的顧客群體特徵主要是:家裡沒有車、年齡在45歲一下、不在北美地區、家裡也沒有孩子(大米國裡面的屌絲層次)、

     同樣還有就是家裡有一輛車、年齡在37到53之間、通勤距離小於10Miles,家裡孩子少於4個,然後年度營收在58000$以上(大米國的高富帥了)

其實決策樹演算法最主要的應用情境就是分析影響某種行為的因素排序,通過這種演算法我們可以知道某些特定群體他們都會有幾個比較重要的屬性,比如家裡有沒有車、年齡等,但是我們想要分析這部分特定群體其特有屬性就沒法做到,而要分析這種特定群體所共同含有的共同屬性就需要今天我們的Microsoft群集演算法出場了,簡單點講就是:物以類分、人以群分,通過群集演算法我們要找到那些將要買單車的顧客群裡都有哪些屬性,比如當我們晚上進入廣場會看到,廣場大媽一群、兒童紮在一群、打籃球的一群、還有一群情侶在廣場邊幽暗的樹林裡等等,而他們這些團隊之間是有差別的,若果要去賣兒童玩具...那種群體是你最想靠近的自然而然了。

技術準備

(1)同樣我們利用微軟提供的案例資料倉儲(AdventureWorksDW2008R2),兩張事實表,一張已有的曆史購買單車記錄的曆史,另外一張就是我們將要挖掘的收集過來可能發生購買單車的人員資訊表,可以參考上一篇文章

(2)VS、SQL Server、 Analysis Services沒啥可介紹的,安裝資料庫的時候全選就可以了。

下面我們進入主題,同樣我們繼續利用上次的解決方案,依次步驟如下:

(1)開啟解決方案,進入到“採礦模型”模板

通過上面可以看到已經存在一種決策樹演算法了,我們來添加另外一種演算法。

2、按右鍵“結構”列,選擇“建立採礦模型”,輸入名稱即可

點擊確定,這樣我們建立立的群集就會增加在採礦模型中,這裡我們使用的主鍵和決策樹一樣,同樣的預測行為也是一樣的,輸入列也是,可以更改。

下一步,部署處理該採礦模型。

結果分析

同樣這裡面我們採用“採礦模型查看器”進行查看,這裡採礦模型我們選擇“Clustering”,這裡面會提供四個選項卡,下面我們依次介紹,直接晒圖:

同行這裡面我們選擇要發生購買單車的群裡,顏色最深的為最會購買單車的群裡,圖中箭頭我們已經顯示出來了,同樣我們也可以找到最不想買單車的一群人,也就是“分類四”,他們之間線條的強弱表示關聯關係強弱,當然這裡為了好記我們可以給他們改改名,直接選擇類,右鍵重新命名。

如,下面我們要做的就是要分析這些群體有啥特徵了,當然我們最關心的為:最想買車的一群人、不想買車的也可以的,至於不想真相的群體、路人群體甲、乙...這個都是些打醬油的了,我們就不分析了。

我們開啟“分類剖面圖”看看:

哈...這幾類群體的特徵已經展示出來了,如果玩資料久了,會對圖表有一種直觀敏銳,對資料也要保持一種特定的嗅覺。今晚我先不分析圖表中這群最想買車的銀的特徵了,明天繼續分析,又看出的可以幫我簡單分析下,同樣先曬幾張結構圖:

 

明晚分析結果,然後將這兩種演算法的特點進行對比分析。對大資料有興趣的不要忘記你的“推薦”哦。

曬一句資料採礦的力量:我就知道你會這麼做!

 

(未完待續.....)

 

(原創)大資料時代:基於微軟案例資料庫資料採礦知識點總結(Microsoft 群集演算法)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.