📄 64.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [合集]验证Apriori算法应生成什么样的数据库
发信站: 南京大学小百合站 (Wed Dec 4 01:05:28 2002), 站内信件
dbfriend (littlefriend) 于Wed Nov 27 10:43:50 2002)
提到:
我看一般的文献上都是写的T10,I4,D100K,D是指交易数目,T是指每条交易的平均长度
吗,那I是指什么。
下载的数据库生成算法是不是都是在Unix上运行的,要是想在vc++上运行怎么办,我也下
载了一个在vc++上运行的程序,可以生成 1 1 milk
1 1 bread
1 1 sugar
2 2 beer
2 2 diaper
类型的数据,第一列是交易ID,第二列是顾客ID ,一般验证Apriori算法是生成这样的数
据库吗,这样生成的T10,D100K数据库很大,300M,
我错在哪里,请各位高手指点
qjqjlqyf (qianjin) 于Wed Nov 27 11:23:35 2002)
提到:
【 在 dbfriend 的大作中提到: 】
: 我看一般的文献上都是写的T10,I4,D100K,D是指交易数目,T是指每条交易的平均..
: 吗,那I是指什么。
: 下载的数据库生成算法是不是都是在Unix上运行的,要是想在vc++上运行怎么办,我..
: 载了一个在vc++上运行的程序,可以生成 1 1 milk
: 1 1 bread
: 1 1 sugar
: 2 2 beer
: 2 2 diaper
: 类型的数据,第一列是交易ID,第二列是顾客ID ,一般验证Apriori算法是生成这样..
: 据库吗,这样生成的T10,D100K数据库很大,300M,
: 我错在哪里,请各位高手指点
:
:
T是指每条交易的平均长度,I指最大潜在的频繁项集的平均长度,一般验证算法,只要生成频
繁项集就行了,如果你愿意也可以生成关联规则.
jimo (寂寞) 于Wed Nov 27 12:55:26 2002提到:
可以你自己转化一下
用整数来表示你的milk bread等
就小很多了
【 在 dbfriend (littlefriend) 的大作中提到: 】
: 我看一般的文献上都是写的T10,I4,D100K,D是指交易数目,T是指每条交易的平均长度
: 吗,那I是指什么。
: 下载的数据库生成算法是不是都是在Unix上运行的,要是想在vc++上运行怎么办,我也下
: 载了一个在vc++上运行的程序,可以生成 1 1 milk
: 1 1 bread
: 1 1 sugar
: 2 2 beer
: 2 2 diaper
: 类型的数据,第一列是交易ID,第二列是顾客ID ,一般验证Apriori算法是生成这样的数
: 据库吗,这样生成的T10,D100K数据库很大,300M,
: 我错在哪里,请各位高手指点
:
:
dbfriend (littlefriend) 于Thu Nov 28 07:54:01 2002)
提到:
用整数来表示数据量也很大,有几百兆,测试数据真的要这么大吗,100000条交易,我机
子的内存只有128M根本打不开,快救救我吧
【 在 jimo 的大作中提到: 】
: 可以你自己转化一下
: 用整数来表示你的milk bread等
: 就小很多了
: 【 在 dbfriend (littlefriend) 的大作中提到: 】
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -