📄 15.txt
字号:
发信人: racineben (racineben), 信区: DataMining
标 题: 频繁项集树的“伺机投影”生成算法分析与实现
发信站: 南京大学小百合站 (Mon Jul 14 13:47:10 2003)
我的毕业论文。
挖掘频繁项集是许多数据挖掘问题中的关键步骤,在本领域提出了许多非常有趣的算法,
但是,它们都只对某种特定形态的数据库是可行的和高效的。
本文分析并且实现了2002年大陆方面收入KDD国际会议的一篇优秀论文:“Mining Freque
nt Item Sets by Opportunistic Projection”,简称OP算法。Op算法是一种杂凑方法,
它集Tree Projection、H-MINE和FP三种经典算法之大成,通过权衡不同表示方式下的相
关投影方式和不同情况下的记数方法的开销来获得最高的效果和最大的可伸缩性。OP算法
主要通过“伺机投影”来构造频繁集。OP算法涉及频繁项集树的多种搜索方式和投影事务
子集的多种表示方法。
在具体的实现中,我通过了一系列的从低到高的数据结构构造了一个演示模型,并使用它
来实现了整个算法。由于假期回家,有些改进要到下学期进行,我已经把毕业论文和正在
调试的深度优先部分的代码上传,还有些小问题,但是程序框架应该是正确的。希望大家
批评指正。
--
英雄当世风云苍
潜龙卧海伺气象
儿女有情当销歇
格物玄机用思量
切望中华日扶起
难藏天际将星扬
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 218.76.43.147]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -