📄 67.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [合集]关联规则和决策树有何联系???
发信站: 南京大学小百合站 (Thu Apr 17 00:28:40 2003)
dequator (不辣丁~我爱南开) 于Tue Apr 8 15:34:50 2003)
提到:
一般的,我们都认为决策树是一种分类方法,而关联规则则是一种知识表示。
数据挖掘所能挖掘出来的知识,我们认为有:
聚类模式
分类模式
关联模式(关联规则)
...(其它的是在说不出来,总是印象很模糊,也许应该有知识模型吧)
等等
至于神经网络等等,也许应该认为是一种挖掘模式的方法吧!
于是决策树和关联规则也许就没什么可以比较的了——根本不是同一类东西,
一个是方法,一个是知识表示形式。
但是,从Microsoft的WinMine Toolkit所产生的东西,我得到了决策树,同时,点击决
策树节点而出来的所谓“详细信息”的弹出对话框里是一个类似“IF ...AND... THEN.."
的东西,我就想这个东西是不是关联规则呢?
于是,我就得出下面的个人理解:
是不是可以认为:
决策树是由一些特定的(所有的“那么”部分都是同一个属性)、足够的(规则树足够,
以至于能够构成树)关联规则构成的树;而关联规则(集)呢,相比于决策树,则是许
多的规则的零散的集合,每一条规则的“如果”部分和“那么”部分都可以是任意多个
的任意属性。
很显然的,
关联规则本身就具有可理解的意义因而被看作为一种知识表达形式;
而决策树主要是用来进行分类决策,分类所针对的那个属性就是所有的规则的那个
“那么”部分,正是因为决策树本身可以理解为由许多关联规则所拼接而成也同样的具
有了可理解的意义从而被保留下来作为一种知识表现形式,只不过它的最终的分类作用
更胜于其本身的知识表示作用罢了!
不知道我所“发掘”的这些东西是不是就像没吃过梨的人吃了一次梨后告诉卖梨的人说
“梨”比一般的水果要甜呢?
不才陋见,还望指点!
suelove (lost love 2003) 于Tue Apr 8 21:17:32 2003)
提到:
one thing is that for classification, the training data must be predefined.
also the decision tree constructed based on the training data may be overfit.
users are only interested in the class attribute. of course you can generate r
ules from a decision tree.
but in association rule mining, it is not necessary to predefined the classes.
association rules covers all the characteristics of the data(if without constr
aint.)
In my point of view, dicision tree can be taken as constraints based associati
on rule mining.
and another difference is that association rule mining is for discriptive purp
ose, while classification is for predictive purpose.
since I read the first data mining paper in english, maybe what we said is the
same.
【 在 dequator 的大作中提到: 】
: 一般的,我们都认为决策树是一种分类方法,而关联规则则是一种知识表示。
: 数据挖掘所能挖掘出来的知识,我们认为有:
: 聚类模式
: 分类模式
: 关联模式(关联规则)
: ...(其它的是在说不出来,总是印象很模糊,也许应该有知识模型吧)
: 等等
: 至于神经网络等等,也许应该认为是一种挖掘模式的方法吧!
: 于是决策树和关联规则也许就没什么可以比较的了——根本不是同一类东西,
: 一个是方法,一个是知识表示形式。
: 但是,从Microsoft的WinMine Toolkit所产生的东西,我得到了决策树,同时,点击..
: 策树节点而出来的所谓“详细信息”的弹出对话框里是一个类似“IF ...AND... THE..
: 的东西,我就想这个东西是不是关联规则呢?
: 于是,我就得出下面的个人理解:
: 是不是可以认为:
: 决策树是由一些特定的(所有的“那么”部分都是同一个属性)、足够的(规则树足..
: 以至于能够构成树)关联规则构成的树;而关联规则(集)呢,相比于决策树,则是..
: 多的规则的零散的集合,每一条规则的“如果”部分和“那么”部分都可以是任意多..
: 的任意属性。
: 很显然的,
: (以下引言省略...)
aih (大阿福) 于Tue Apr 8 22:26:19 2003)
提到:
个人认为:关联规则的目标是挖掘出数据集中可能存在的一些规则,而决策树所形成的
所谓if...and...then...只不过是一种分类方法,即通过这种分类方法可以将数据分到
哪个类中,但并不是数据集中本身可能含有的规则。
两者的表示形式有相同之处,但意义完全不同
在 dequator (不辣丁~我爱南开) 的大作中提到: 】
: 一般的,我们都认为决策树是一种分类方法,而关联规则则是一种知识表示。
: 数据挖掘所能挖掘出来的知识,我们认为有:
: 聚类模式
: 分类模式
: 关联模式(关联规则)
: ...(其它的是在说不出来,总是印象很模糊,也许应该有知识模型吧)
: 等等
: 至于神经网络等等,也许应该认为是一种挖掘模式的方法吧!
: 于是决策树和关联规则也许就没什么可以比较的了——根本不是同一类东西,
: 一个是方法,一个是知识表示形式。
: 但是,从Microsoft的WinMine Toolkit所产生的东西,我得到了决策树,同时,点击决
: 策树节点而出来的所谓“详细信息”的弹出对话框里是一个类似“IF ...AND... THEN.."
: 的东西,我就想这个东西是不是关联规则呢?
: 于是,我就得出下面的个人理解:
: 是不是可以认为:
: 决策树是由一些特定的(所有的“那么”部分都是同一个属性)、足够的(规则树足够,
: 以至于能够构成树)关联规则构成的树;而关联规则(集)呢,相比于决策树,则是许
: 多的规则的零散的集合,每一条规则的“如果”部分和“那么”部分都可以是任意多个
: 的任意属性。
: 很显然的,
: (以下引言省略 ... ...)
NAOMIELIE (雁来红) 于Tue Apr 8 23:46:13 2003)
提到:
Refer to Bing Liu's paper on CAR (Classification Association Rule) mining
paper.
Dr. Liu Hongyan in Tsinghua has papers on this topic on VLDB etc.
You can also refer to her thesis.
-naomi
【 在 dequator 的大作中提到: 】
: 一般的,我们都认为决策树是一种分类方法,而关联规则则是一种知识表示。
: 数据挖掘所能挖掘出来的知识,我们认为有:
: 聚类模式
: 分类模式
: 关联模式(关联规则)
: ...(其它的是在说不出来,总是印象很模糊,也许应该有知识模型吧)
: 等等
: 至于神经网络等等,也许应该认为是一种挖掘模式的方法吧!
: 于是决策树和关联规则也许就没什么可以比较的了——根本不是同一类东西,
: 一个是方法,一个是知识表示形式。
: 但是,从Microsoft的WinMine Toolkit所产生的东西,我得到了决策树,同时,点击..
: 策树节点而出来的所谓“详细信息”的弹出对话框里是一个类似“IF ...AND... THE..
: 的东西,我就想这个东西是不是关联规则呢?
: 于是,我就得出下面的个人理解:
: 是不是可以认为:
: 决策树是由一些特定的(所有的“那么”部分都是同一个属性)、足够的(规则树足..
: 以至于能够构成树)关联规则构成的树;而关联规则(集)呢,相比于决策树,则是..
: 多的规则的零散的集合,每一条规则的“如果”部分和“那么”部分都可以是任意多..
: 的任意属性。
: 很显然的,
: (以下引言省略...)
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -