⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 550.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: brazil (rainbow), 信区: DataMining
标  题: integrating classification and association rule m
发信站: 南京大学小百合站 (Mon Aug  5 16:00:28 2002)

在integrating classification and association rule mining(上载文件区中有)一文中
,给出了一种关联分类的方法,大致分为两步:生成所有的类关联规则,建立分类器。


在第二步,又细分为1.对类关联规则排序2.按照排序,为构建分类器选择规则,放在集合
C中3.删除C中不能提高分类器准确率的规则。


问题:

1.在上述的3中,文中是这样写的:find the first rule p in C with the lowest tota
l number of errors and drop all the rules after p in C;

classifier是形如<r1,r2,...,rn,default_class>的格式。

问:经过3的处理,难道C中只剩下一条规则p和其对应的default class? 

first如何理解?例如,有两条rules具有同样的lowest total number of errors,是不是
只选择第一条rule,因为按照排序,它的优先级高一些?


2.total number of errors是如何计算的?

文中是这样写的:the total number of errors that are made by the current C and 
the default class.This is the sum of the number of errors that have been made 
by all the selected rules in C and the number of errors to be made by the defa
ult class in the training cata.

按字面意思,我的理解为:total number of errors是计算C中的rules对初始数据集D中样
本的错分数,且随着规则r被不断插入C,the total number of errors是不断增大的。这句
话和上述问题1中的文字好像有冲突,所以我理解the first rule p in C with the lowe
st total number of errors中的total number of errors只是针对rule p而言的,不是t
he sum of ...,不知我理解的对不对?




--

※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 210.78.144.40]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -