📄 875.txt
字号:
发信人: hillwind (骨折中...), 信区: DataMining
标 题: 粗糙集的两点疑惑
发信站: 南京大学小百合站 (Sun Nov 17 14:29:25 2002), 站内信件
看了几天粗糙集,感觉在两点上面有些问题,请大家指点一下,多谢
1. 按照粗糙集的定义,如果去除某个条件属性会改变条件属性相对于决策属性的正域
,则该条件属性属于该决策表的核,即对分类来说是必不可少的。
考虑这样一个决策表,其中某个条件属性是身份证号码,即所有的对象在该属性的取值
都是不同的。因为这样的条件属性使得知识的粒度达到最低,如果去除则很可能会影响条
件属性相对
决策属性的正域,这样该属性就成为产生的约简中的一个属性,但是这样的属性对预测
是没有作用的。更为可怕的是,当新的对象需要分类的时候,因为身份证号码不一样,
所以规则的前件没有一个是符合的,只能够取默认的类别。
如果上面的想法是正确的,那么对分类而言,粗糙集是不能正确的对属性进行选择的。是
不是
用粗糙集进行分类之前一定要先进行面向属性的归纳,取出上面诸如身份证号码这样的
属性。
2.粗糙集的本质是“让对象自己说话”,但是这样产生的一个结果就是,规则集相当的
庞大,并不容易理解。例如,如果某个决策表的约简有10个属性,每个属性的取值有2个
,那么产生的规则集会接近1024个,而且每个规则的前件的属性个数都为10(或者简化
后接近10)。这样粗糙集产生的分类器很可能就是一个黑箱,不能被很好的理解。而且
我觉得很难有算法可以把这么多的规则进行精简。
请问上面的想法有没有错误,对粗糙集感兴趣的同仁一起来讨论一下吧。
--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 166.111.187.191]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -