📄 12.txt
字号:
发信人: qjqjlqyf (qianjin), 信区: DataMining
标 题: Re: 验证Apriori算法应生成什么样的数据库
发信站: 南京大学小百合站 (Wed Nov 27 11:23:35 2002)
【 在 dbfriend 的大作中提到: 】
: 我看一般的文献上都是写的T10,I4,D100K,D是指交易数目,T是指每条交易的平均..
: 吗,那I是指什么。
: 下载的数据库生成算法是不是都是在Unix上运行的,要是想在vc++上运行怎么办,我..
: 载了一个在vc++上运行的程序,可以生成 1 1 milk
: 1 1 bread
: 1 1 sugar
: 2 2 beer
: 2 2 diaper
: 类型的数据,第一列是交易ID,第二列是顾客ID ,一般验证Apriori算法是生成这样..
: 据库吗,这样生成的T10,D100K数据库很大,300M,
: 我错在哪里,请各位高手指点
:
:
T是指每条交易的平均长度,I指最大潜在的频繁项集的平均长度,一般验证算法,只要生成频
繁项集就行了,如果你愿意也可以生成关联规则.
------------------
我总感觉所做的实验有点虚,无论怎么样的结果,与实际应用有差距.
--
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 210.47.34.25]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -