使用Google Analytics辨別虛假流量

來源:互聯網
上載者:User

  虛假流量是指那些為了騙取廣告費通過人為操作產生的流量,(人為操作可能是點擊你的廣告,訪問制定的landingpage,或者完成某個簡單的任務。具體情況還要根據不同的廣告形式來判斷。)這種流量通常不會在網站上產生任何轉化行為。虛假流量可能是通過程式產生的,也可能是人肉產生的。後者的成本會更高些。行為更智能一些。也更難防範。

  這裡簡單的介紹幾種使用Google Analytics辨別虛假流量的方法。首先把流量產生的背景設定為某種CPA(Cost Per Action)廣告,並且我們對廣告的URL通過工具網址構建器將來源統一設定為bluewhale(utm_source=bluewhale)。這樣,所有通過這個廣告產生的流量來源都將被記為bluewhale

  具體的廣告URL形式:

  http://bluewhale.cc/?utm_source=bluewhale&utm_medium=cpa&utm_campaign=bluewhale_traffic

  下面在Google Analytics報告中對這個廣告產生的流量進行檢查,看看是否有虛假流量存在。檢查的思路是先分割出廣告產生的流量。然後使用不同的維度對這部分流量進行檢查。通常虛假流量都是人為控制完成的。在行為上會有一些統一的特徵。檢查的方法就是找到這些統一的特徵。

  使用進階群組分割流量

  在檢查前先要將這部分廣告流量與網站的其他流量進行分割,進階群組是最好的選擇。因為我們之前對流量進行過來源標記,所以只需要建立一個來源等於bluewhale的進階群組就可以分割出這部分流量了。

  

  建立完成後,在報告中選擇使用這個進階群組。這部分流量將會貫穿整個報告。這也是在檢查流量前的準備工作。避免其他來源流量的幹擾。

  流量產生的時間

  使用的Google Analytics報告:訪問者—訪問者趨勢—訪問次數

  

  這裡的時間要精確到每小時的訪問資料。通常,網站正常的訪問流量會分布在一天中的各個時段,即使有訪問高峰,在曲線圖中也會是較為平滑的曲線(廣告剛上線時除外)。而虛假流量是人為控制產生的流量。為節省成本不會在意流量的時間分布,所以會在時間曲線上發現流量突增的情況。所以,如果流量過於集中在某個時段,或者在某個時段有了不正常的增長。這部分流量就可疑了。

  當然也不排除有的程式會計算好日期和時間端,並按時間曲線類比點擊。如果碰到這種“智能流量”的情況,就要繼續使用第二種方法。

  流量的地理來源

  

  使用的Google Analytics報告:訪問者—地圖覆蓋圖

  通常訪問網站的訪客會來自各個不同的地理位置(Google Analytics通過訪問者的IP來判斷流量來源的地理位置資訊)。所以在地圖覆蓋圖報告中可以看到很多不同地區的流量來源。而虛假流量通常很難使用多個地區的不同IP來產生流量。所以通過地區覆蓋圖來看,如果流量來源都集中在一個地區,這部分流量就很可疑了。

  這裡可能你的廣告只針對某個地區的訪客,所以訪客的地理位置範圍對你不適用。或者是你又遇到了“更加智能”的流量,比如,人肉流量!可以通過代理或者是分布在不同地區的兼職人員類比出來自多個地理位置的訪問。那麼請接著往下看。

  流量的網路屬性

  使用的Google Analytics報告:訪問者—服務提供者

  

  服務提供者報告顯示的是網站訪客所使用的網路接入方式,正常情況下網站訪問者的接入方式應該是千差萬別。而虛假流量的接入方式會很單一。所以如果這個報告裡只顯示了1-2種服務提供者名稱,就說明你的流量很可疑了。但其實這裡還是沒有回答上面的問題,就是那部分超級智能的人肉流量。因為人肉流量的接入方式也會有很多種,在服務提供者報告裡是無法識別出來的。那該如何辨別人肉流量呢?別急,這個問題很快就會有答案了。

  流量的跳出率

  使用的Google Analytics報告:訪問者—訪問者趨勢—跳出率

  

  跳出率是衡量頁面品質的指標,反過來看,也是辨別虛假流量的好工具。如果發現在某個時段網站的跳出率突然增高,找到那個時段的流量與前面的訪次時間段,地理位置資訊和接入方式綜合對比。如果符合前面的任何一個條件,這部分時段的流量都非常可疑。

  流量的網站停留時間

  使用的Google Analytics報告:訪問者—訪問者趨勢—網站停留時間

  

  網站停留時間其實並不是一個非常準確的指標,會受到cookie30分鐘生存期的影響。但可以配合著前面的幾個報告共同對可疑流量進行進一步驗證。

  進入路徑&點擊分布圖

  使用的Google Analytics報告:內容—熱門內容—進入路徑

  

  通常我們都會為廣告活動制定一個登入頁面 landingpage,所以廣告的入口頁面只有一個。但訪問者來到網站後會有不同的行為,他們會點擊不同的連結,訪問不同的頁面,並且在不同的頁面結束對網站的訪問。這些都是人為操控很難完成的。雖然現在的某些“智能流量”也能完成2-3次的點擊行為。但都是通過預先設定的。所以它們的訪問路徑和結束頁面基本相同。

  與目標報告匹配

  使用的Google Analytics報告:流量來源—目標

  

  最後一種方法,也是你在每次的廣告活動前最應該做的。就是為流量設定目標。Google Analytics現在升級了目標功能。你可以為流量設定多個目標。通過多個維度來檢查流量。目標的完成度是辨別虛假流量的最好方法。很多智能流量可以繞過跳出率,停留時間和訪問時間分布等等指標,但很少有能夠完成目標的。當然這也要依你設定目標的複雜程度來定。如果設定的CPA是完成購物,那麼這對虛假流量來說就是一個殺手級的目標。如果目標只是註冊使用者或者是填寫資訊,人肉流量都是可以完成的。

  本篇的幾種方法都已經說完了,好像還是沒有能完全辨別出虛假流量的方法。是的,虛假流量在不斷的模模擬實的流量。並且人肉流量又是那麼廉價。讓我們防不勝防。(之前看過一篇文章裡介紹說,人肉流量的一個點擊只有幾分錢,很多學校裡整個宿舍都在進行這種任務。)單靠Google Analytics報告可以辨別出一部分虛假流量,更多的虛假流量要通過時間的檢驗才能夠現形。比如在廣告活動期過後,這部分流量的回訪率,駐留率,等等。

  大家對虛假流量有更好的辨別方法嗎?也和我共用一下你的經驗吧。期待你們的留言。

  ——【所有文章及圖片著作權歸 藍鯨(王彥平)所有。歡迎轉載,但請註明轉自“藍鯨網站分析部落格”。】——

  Read more: http://bluewhale.cc/2010-04-24/google-analytics-identify-false-traffic.html#ixzz1Jvx2wEQb



相關文章

E-Commerce Solutions

Leverage the same tools powering the Alibaba Ecosystem

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。