📄 80.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [合集]请教有序属性的数据挖掘问题
发信站: 南京大学小百合站 (Sat May 10 18:22:59 2003)
mining (key) 于Mon May 5 16:45:10 2003)
提到:
属性可以简单的分为:
连续属性,即取实数值的属性;
名义属性,如颜色,方位,性别等;
有序属性,如高、中、低,很差、差、一般、良好、优秀等。
由于传统的符号归纳机器学习没有考虑属性之间的序的关系,因此忽略了有序属性的这
维序信息。
有什么办法能解决这个问题吗,或者有没有这方面的论文?
我找了很久也没发现有这方面的论述,是不是这个问题没有研究的价值?
恳切各位大牛讨论!
daniel (飞翔鸟) 于Mon May 5 16:59:10 2003)
提到:
【 在 mining (key) 的大作中提到: 】
: 属性可以简单的分为:
: 连续属性,即取实数值的属性;
: 名义属性,如颜色,方位,性别等;
: 有序属性,如高、中、低,很差、差、一般、良好、优秀等。
: 由于传统的符号归纳机器学习没有考虑属性之间的序的关系,因此忽略了有序属性的这
: 维序信息。
wrong
: 有什么办法能解决这个问题吗,或者有没有这方面的论文?
: 我找了很久也没发现有这方面的论述,是不是这个问题没有研究的价值?
: 恳切各位大牛讨论!
连续属性/离散属性,有序属性/无序属性,本来是不同的划分方式,有序属性
和连续属性严格地说是不应该放到一起的
有序属性/无序属性10多年前就被研究过了,现在的很多工作其实是基于这种划分
的。比较早的可以看Utgoff和Brodley在ICML90的文章。
NAOMIELIE (雁来红) 于Mon May 5 17:07:11 2003)
提到:
I think what he metioned is statistics people's viewpoint:
cardinal, nominal, ordinal, categorical, numerical, etc.
【 在 daniel 的大作中提到: 】
: 【 在 mining (key) 的大作中提到: 】
: wrong
: 连续属性/离散属性,有序属性/无序属性,本来是不同的划分方式,有序属性
: 和连续属性严格地说是不应该放到一起的
: 有序属性/无序属性10多年前就被研究过了,现在的很多工作其实是基于这种划分
: 的。比较早的可以看Utgoff和Brodley在ICML90的文章。
daniel (飞翔鸟) 于Mon May 5 17:10:55 2003)
提到:
【 在 NAOMIELIE (雁来红) 的大作中提到: 】
: I think what he metioned is statistics people's viewpoint:
: cardinal, nominal, ordinal, categorical, numerical, etc.
ordinal是指序数属性
有序/无序是ordered/unordered
:
: 【 在 daniel 的大作中提到: 】
mining (key) 于Mon May 5 18:25:55 2003)
提到:
谢谢daniel大虾的指点。确实我说的的分类方法存在问题。
我做这方面的工作时间很短,对有些概念的理解很浅薄。尤其是对这方面研究的历史无
所了解,所以制约了对一些问题的理解。
但我还是有一个疑问:
虽然这个问题被研究了,但为什么现在的符号归纳机器学习很少提及这个问题呢?
比如说ID3算法,显然就不能考虑这种序信息,它可能挖到两条这样的规则:
if experience(good) then accept;
if experience(excellent) then accept.
对于人们而言很容易就能知道第一条规则与第二条规则之间的关系。
但现在的机器学习算法却没考虑这种关系, 而是将其作为两条毫无关系规则。
难道无需考虑吗?
请大家指点。
【 在 daniel (飞翔鸟) 的大作中提到: 】
: 【 在 NAOMIELIE (雁来红) 的大作中提到: 】
: ordinal是指序数属性
: 有序/无序是ordered/unordered
daniel (飞翔鸟) 于Mon May 5 19:30:04 2003)
提到:
【 在 mining (key) 的大作中提到: 】
: 谢谢daniel大虾的指点。确实我说的的分类方法存在问题。
: 我做这方面的工作时间很短,对有些概念的理解很浅薄。尤其是对这方面研究的历史无
: 所了解,所以制约了对一些问题的理解。
: 但我还是有一个疑问:
: 虽然这个问题被研究了,但为什么现在的符号归纳机器学习很少提及这个问题呢?
: 比如说ID3算法,显然就不能考虑这种序信息,它可能挖到两条这样的规则:
: if experience(good) then accept;
: if experience(excellent) then accept.
: 对于人们而言很容易就能知道第一条规则与第二条规则之间的关系。
: 但现在的机器学习算法却没考虑这种关系, 而是将其作为两条毫无关系规则。
: 难道无需考虑吗?
: 请大家指点。
ID3不是“现在的”方法,提出ID3的时候,ordered/unordered的划分还没被提出来。
另外,ID3不是规则学习算法,怎么得出规则,并不是ID3 care的事情。
: 【 在 daniel (飞翔鸟) 的大作中提到: 】
mining (May_flowers) 于Mon May 5 19:43:11 2003)
提到:
那请问有什么算法能考虑这个问题吗?因为我感觉这确实是一个问题。
如果没有,我们可以研究,如果有对问非常有用!
谢谢。
【 在 daniel (飞翔鸟) 的大作中提到: 】
: 【 在 mining (key) 的大作中提到: 】
: ID3不是“现在的”方法,提出ID3的时候,ordered/unordered的划分还没被提出来。
: 另外,ID3不是规则学习算法,怎么得出规则,并不是ID3 care的事情。
mining (May_flowers) 于Mon May 5 19:53:38 2003)
提到:
我找到了Hybrid Decision Tree ——Zhi-Hua Zhou, Zhao-Qian Chen
我想我还是先拜读了你的大作,有问题再向你请教吧。
非常感谢。
【 在 mining (May_flowers) 的大作中提到: 】
: 那请问有什么算法能考虑这个问题吗?因为我感觉这确实是一个问题。
: 如果没有,我们可以研究,如果有对问非常有用!
: 谢谢。
: 【 在 daniel (飞翔鸟) 的大作中提到: 】
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -