我們會發現很多網站都具備了內容推薦的功能,不僅是像B2C電子商務類的卓越的圖書推薦,也包括興趣類網站像豆瓣的豆瓣猜等。 這類功能無疑在説明使用者發現需求,促進商品購買和服務應用方面起到了顯著性的效果。 那麼這類的推薦是怎麼得到的呢? 其實跟網站資料分析不無相關,我們可以來簡單看一下它的原理和實現。
關聯推薦在行銷上被分為兩類:
向上行銷(Up Marketing):根據既有客戶過去的消費喜好,提供更高價值或者其他用以加強其原有功能或者用途的產品或服務。
交叉行銷(Cross Marketing):從客戶的購買行為中發現客戶的多種需求,向其推銷相關的產品或服務。
向上行銷是基於同類產品線的升級或優化產品的推薦,而交叉行銷是基於相似但不同類的產品的推薦。 舉個簡單的例子,可以看一下蘋果的產品線:
當你購買一個ipod nano3的時候,向你推薦升級產品nano4、nano5或者功能類似的itouch就叫做「向上行銷」;而推薦Iphone、Mac或ipad的時候就是「交叉行銷」了。
而關聯推薦在實現方式上也可以分為兩種:以產品分析為基礎的關聯推薦和以使用者分析為基礎的關聯推薦。 產品分析的關聯推薦指的是通過分析產品的特徵發現它們之間的共同點,比如《Web Analytics》和《Web Analytics 2.0》的作者都是Avinash Kaushik,而且書名都包含Web Analytics, 都是網站分析類的書籍,同時也可能是同一個出版社...... 那麼基於產品的關聯就可以向購買了《Web Analytics》的使用者推薦《Web Analytics 2.0》。 而基於使用者分析的推薦是通過分析使用者的歷史行為資料,可能會發現購買了《Web Analytics》的很多使用者也買了《The Elements of User Experience》這本書,那麼就可以基於這個發現進行推薦, 這種方法就是資料採礦中的關聯規則(Association Rules)挖掘,其中最經典的案例就是沃爾瑪的啤酒和尿布的故事。
目前很多的關聯推薦還是基於產品層面的,因為實現上更為簡單(對於網站而言,產品資料明顯少於使用者行為資料,而且可能相差好幾個數量級,所以分析工作就會輕很多),基於產品的推薦更多地以上面所述的兩種行銷手段來實現,更偏向于傳統的 「推式」行銷(個人對這種行銷方式比較沒有好感,尤其「捆綁銷售」之類)。
基於使用者行為分析的關聯推薦
所以個人更偏向于基於使用者分析的實現方式,這樣更有利於發現使用者的潛在需求,説明使用者更好的選擇它們需要的產品,並由使用者決定是否購買,也就是所謂的「拉式」行銷。 通過向使用者推薦產品或服務,激發使用者的潛在需求,促使使用者消費,更加符合「以使用者為中心」的理念。 所以下面主要簡單描述下以使用者行為分析為基礎的關聯推薦,無論你是電子商務網站或是其他任何類型的網站,其實都可以實現這個功能,只要你具備以下前提:
1、 能夠有效地識別網站使用者;
2、保留了使用者的歷史行為資料(點選流資料(clickstream)或運營資料(outcomes));
3、當然還需要一個不錯的網站資料分析師。
這裡以電子商務網站為例來說明一下關聯規則的具體實現。 目前大部分電子商務網站都提供使用者註冊的功能,而購物的使用者一般都是基於登錄的條件下完成的,所以這裡為使用者識別提供了最為有效的標示符——使用者ID(關於使用者識別的方法,請參考這篇文章——網站使用者的識別) ;同時網站會把所有使用者的購物資料儲存在自己的運營資料庫裡面,這個為使用者行為分析提供了資料基礎——使用者歷史購物資料。 所以滿足了上述的前兩個條件,我們就可以著手進行分析了。
關聯規則的實現原理是從所有的使用者購物資料中(如果資料量過大,可以選取一定的時間區間,如一年、一個季度等),尋找當使用者購買了A商品的基礎上,又購買了B商品的人數所占的比例,當這個比例達到了預設的一個目標水準的時候, 我們就認為這兩個商品是存在一定關聯的,所以當使用者購買了A商品但還未購買B商品時,我們就可以向該類使用者推薦B商品。 如下圖:
從上圖可以看到其中牽涉3個集合:所有購買過商品的使用者全集U、購買了A商品的使用者集合A以及在購買了A商品之後又購買了B商品的使用者集合G。 基於這3個集合可以計算關聯規則挖掘中的2個關鍵指標——支援度(Support)和置信度(Confidence):
支援度=購買了A和B商品(集合G)的人數/所有購買過商品(集合U)的人數
置信度=購買了A和B商品(集合G)的人數/購買了A商品(集合A)的人數
得到這兩個指標之後,需要為這兩個指標設立一個最低門檻,即最小支援度和最小置信度。 因為在使用者的購買行為中,購買A商品的使用者可能不僅購買B商品,還購買了C、D、E...... 等一系列商品,所以我們需要分別算出所有這些組合的支援度和置信度,只有滿足比如支援度>0.2,置信度>0.6的這些商品組合才可以認為是有關聯的,值得推薦的。
當然,如果你的網站不是電子商務網站,你同樣可以用使用者流覽網站的點選流資料實現關聯推薦的功能。 同樣是基於使用者歷史行為,比如流覽了A頁面的使用者也流覽的B頁面、觀看了A視頻的使用者也觀看了B視頻、下載了A檔的使用者也下載了B檔......
資料採礦中的關聯規則挖掘一般採用基於頻繁集的Apriori演算法,是一個較為簡單有效的演算法,這裡就不具體介紹了,有興趣的朋友可以去查下資料。
在進行關聯規則分析時需要注意的一些問題
@注意關聯推薦的適用範圍和前提條件,並不是每一類網站都適合或需要進行關聯推薦的;
@最小支援度和最小執行度的設立需要根據網站運營的特徵設定,不宜偏高或偏低,建議基於實驗或實踐的基礎上不斷優化,尋找一個最佳的權衡點。
@需要特別注意的是,在關聯規則中A商品與B商品有關聯,並不意味著B商品與A商品的關聯也成立,因為兩者的置信度演算法是不同的,關聯方向不可逆。
@關聯規則分析在演算法上其實並不難,但是要將其在網站上真正實現好,在滿足上面3個前提的基礎上還需要持續地優化演算法,而更主要的是需要網站各部門的協作實現。
所以,基於使用者行為分析的關聯推薦完全從使用者的角度進行分析,比單純地比較產品間的關聯更為深入和有效,更加符合使用者的行為習慣,有利於發現使用者的潛在需求,不妨嘗試一下。
源位址:HTTP://webdataanalysis.ne......commendation/