📄 903.txt
字号:
发信人: ncfan (fan), 信区: DataMining
标 题: Re: 粗糙集的两点疑惑
发信站: 南京大学小百合站 (Tue Nov 19 18:52:38 2002), 站内信件
呵呵,我也不太懂,随便说说
1。 这种问题是存在的,有时某个属性是随机产生的,其实没有
什么意义。也属于这种情况,应该首先去掉
2。rough对大规模的数据一向很难处理
【 在 hillwind (骨折中...) 的大作中提到: 】
: 看了几天粗糙集,感觉在两点上面有些问题,请大家指点一下,多谢
: 1. 按照粗糙集的定义,如果去除某个条件属性会改变条件属性相对于决策属性的正域
: ,则该条件属性属于该决策表的核,即对分类来说是必不可少的。
: 考虑这样一个决策表,其中某个条件属性是身份证号码,即所有的对象在该属性的取值
: 都是不同的。因为这样的条件属性使得知识的粒度达到最低,如果去除则很可能会影响条
: 件属性相对
: 决策属性的正域,这样该属性就成为产生的约简中的一个属性,但是这样的属性对预测
: 是没有作用的。更为可怕的是,当新的对象需要分类的时候,因为身份证号码不一样,
: 所以规则的前件没有一个是符合的,只能够取默认的类别。
: 如果上面的想法是正确的,那么对分类而言,粗糙集是不能正确的对属性进行选择的。是
: 不是
: 用粗糙集进行分类之前一定要先进行面向属性的归纳,取出上面诸如身份证号码这样的
: 属性。
: 2.粗糙集的本质是“让对象自己说话”,但是这样产生的一个结果就是,规则集相当的
: 庞大,并不容易理解。例如,如果某个决策表的约简有10个属性,每个属性的取值有2个
: ,那么产生的规则集会接近1024个,而且每个规则的前件的属性个数都为10(或者简化
: 后接近10)。这样粗糙集产生的分类器很可能就是一个黑箱,不能被很好的理解。而且
: 我觉得很难有算法可以把这么多的规则进行精简。
: 请问上面的想法有没有错误,对粗糙集感兴趣的同仁一起来讨论一下吧。
--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 202.120.224.18]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -