📄 540.txt
字号:
发信人: roamingo (漫步鸥), 信区: DataMining
标 题: Re: (实例)再次请教用sql语句实现Apriori算法.
发信站: 南京大学小百合站 (Mon Nov 26 18:59:51 2001), 站内信件
这样的数据库设计如何写? (要么就是我理解错了) 正确的格式至少应该是:
Tid Items
100 I1
100 I2
100 I3
200 I2
200 I3
200 I5
...
基于以上表结构, 建议导出到文本文件(table.txt), 再运行Borgelt的Apriori算法:
apriori.exe -s50 -c90 table.txt rule.txt
既可. 否则也可修改apriori的源代码, 从数据库中读取记录, 但似乎会麻烦一些.
用SQL得到L1还可以用:
select items, count(*) as support from table1
group by items having count(*) >= 2
但要得到L2,L3恐怕是比较麻烦的.
【 在 chineseeagle (steven) 的大作中提到: 】
: 表如下:
: Table name:table1
: Tid Items
: 100 I1,I3,I4
: 200 I2,I3,I5
: 300 I1,I2,I3,I5
: 400 I2,I5
: 给定的minsupport=50%,mincofidence自定.
: 由apriori算法,首先求得频繁集为:
: L1={I1,I2,I3,I5}
: L2={{I1,I3},{I2,I3},{I2,I5},{I3,I5}}
: L3={{I2,I3,I5}}
: 频繁集L=L1+L2+L3
: 再根据给定的minconfidence我们便可得到所求得关联规则(association rules).
: 请问各位怎样用sql语句在oracle8i(或其他关系数据库)实现上述算法?代码最好:)
: 多谢!
--
Read digitally, save a tree.
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 202.120.7.27]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -