📄 903.txt

📁 This complete matlab for neural network

💻 TXT

字号:

发信人: ncfan (fan), 信区: DataMining
标  题: Re: 粗糙集的两点疑惑
发信站: 南京大学小百合站 (Tue Nov 19 18:52:38 2002), 站内信件

呵呵，我也不太懂，随便说说
1。 这种问题是存在的，有时某个属性是随机产生的，其实没有
什么意义。也属于这种情况，应该首先去掉
2。rough对大规模的数据一向很难处理

【 在 hillwind (骨折中...) 的大作中提到: 】
: 看了几天粗糙集，感觉在两点上面有些问题，请大家指点一下，多谢
: 1. 按照粗糙集的定义，如果去除某个条件属性会改变条件属性相对于决策属性的正域
: ，则该条件属性属于该决策表的核，即对分类来说是必不可少的。
: 考虑这样一个决策表，其中某个条件属性是身份证号码，即所有的对象在该属性的取值
: 都是不同的。因为这样的条件属性使得知识的粒度达到最低，如果去除则很可能会影响条
: 件属性相对
: 决策属性的正域，这样该属性就成为产生的约简中的一个属性，但是这样的属性对预测
: 是没有作用的。更为可怕的是，当新的对象需要分类的时候，因为身份证号码不一样，
: 所以规则的前件没有一个是符合的，只能够取默认的类别。
: 如果上面的想法是正确的，那么对分类而言，粗糙集是不能正确的对属性进行选择的。是
: 不是
: 用粗糙集进行分类之前一定要先进行面向属性的归纳，取出上面诸如身份证号码这样的
: 属性。
: 2.粗糙集的本质是“让对象自己说话”，但是这样产生的一个结果就是，规则集相当的
: 庞大，并不容易理解。例如，如果某个决策表的约简有10个属性，每个属性的取值有2个
: ，那么产生的规则集会接近1024个，而且每个规则的前件的属性个数都为10（或者简化
: 后接近10）。这样粗糙集产生的分类器很可能就是一个黑箱，不能被很好的理解。而且
: 我觉得很难有算法可以把这么多的规则进行精简。
: 请问上面的想法有没有错误，对粗糙集感兴趣的同仁一起来讨论一下吧。


--
※ 来源:．南京大学小百合站 bbs.nju.edu.cn．[FROM: 202.120.224.18]

💿 文件大小 7787 K

👤 上传用户 zdh103

📂 所属分类 matlab例程

🏷️ 相关标签

#complete #network #matlab #neural

⌨️ 快捷键说明

复制代码 Ctrl + C

搜索代码 Ctrl + F

全屏模式 F11

切换主题 Ctrl + Shift + D

显示快捷键 ?

增大字号 Ctrl + =

减小字号 Ctrl + -