基於節點列表的項集表示架構的頻繁項集挖掘最新進展,架構最新進展

來源:互聯網
上載者:User

基於節點列表的項集表示架構的頻繁項集挖掘最新進展,架構最新進展
最新的論文在Expert Systems with Applications 2015 42卷13期上發表。
這篇論文採用等價類別提升的策略,極大地提升了挖掘的速度,並且節省了記憶體消耗。所形成的PrePost+演算法在時間和空間的效能度要明顯優於PrePost和FIN演算法。
PrePost+演算法的為:http://www.cis.pku.edu.cn/faculty/system/dengzhihong/Source%20Code/prepost+.cpp


相關論文的:
http://www.sciencedirect.com/science/article/pii/S0957417415001803


由於節點列表的表示方法從底層極大減少了計算項集支援度的時間,所以PrePost+、PrePost和FIN可以擴張挖掘Rare Itemsets, Closed Itemsets, Maximal Itemsets, Frequent Generator Itemsets, Frequent Itemsets from Data Stream, Frequent Itemsets from Uncertain Data等。
另外,這三個演算法也特別適合修改成並行的頻繁模式挖掘演算法(如基於GPU,Hadoop等並行計算平台)。有興趣的同行可以開展上述工作的研究。

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.