📄 550.txt
字号:
发信人: brazil (rainbow), 信区: DataMining
标 题: integrating classification and association rule m
发信站: 南京大学小百合站 (Mon Aug 5 16:00:28 2002)
在integrating classification and association rule mining(上载文件区中有)一文中
,给出了一种关联分类的方法,大致分为两步:生成所有的类关联规则,建立分类器。
在第二步,又细分为1.对类关联规则排序2.按照排序,为构建分类器选择规则,放在集合
C中3.删除C中不能提高分类器准确率的规则。
问题:
1.在上述的3中,文中是这样写的:find the first rule p in C with the lowest tota
l number of errors and drop all the rules after p in C;
classifier是形如<r1,r2,...,rn,default_class>的格式。
问:经过3的处理,难道C中只剩下一条规则p和其对应的default class?
first如何理解?例如,有两条rules具有同样的lowest total number of errors,是不是
只选择第一条rule,因为按照排序,它的优先级高一些?
2.total number of errors是如何计算的?
文中是这样写的:the total number of errors that are made by the current C and
the default class.This is the sum of the number of errors that have been made
by all the selected rules in C and the number of errors to be made by the defa
ult class in the training cata.
按字面意思,我的理解为:total number of errors是计算C中的rules对初始数据集D中样
本的错分数,且随着规则r被不断插入C,the total number of errors是不断增大的。这句
话和上述问题1中的文字好像有冲突,所以我理解the first rule p in C with the lowe
st total number of errors中的total number of errors只是针对rule p而言的,不是t
he sum of ...,不知我理解的对不对?
--
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 210.78.144.40]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -