資料採礦之關聯分析的基本概念

來源:互聯網
上載者:User
文章目錄
  • 6.2.1.The Apriori Principle
6.關聯分析6.1.Problem Definition

  關聯分析(Association Analysis)是指從大量的資料集中,搜尋出有強關聯的規則(Rule),但是這個計算過程通常計算成本很高。建立關聯規則的兩個重要判據是:Support以及Confidence。Support簡單地講,就是指在資料集中,包含規則中所有Item的條目越多,Support越大,就越能夠排除偶然因素的影響。而Confidence則是,當規則前件出現時,規則後件出現地越多,Confidence越大。我們在關聯分析中所要做的工作,就是找出所有超過特定閾值的關聯規則。

  但是對於一個條目,它包含了許多個Item,理論上所能夠構成的規則特別多,如何有效快速地從這些規則中篩選出那些有用的規則是關聯分析的重點。因此,我們通常將關聯分析分成兩部分:(1)Frequent Itemset Generation,從可能的Itemset中找出比較頻繁出現的那些Itemset;(2)Rule Generation:則是在(1)之後,形成強關聯規則。

6.2.Frequent Itemset Generation

  這部分工作的計算複雜度高,我們通常用來減少(1)候選itemset的個數;(2)減少比較的次數來降低計算複雜度。

6.2.1.The Apriori Principle

  

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.