📄 838.txt
字号:
发信人: 8088 (8088), 信区: DataMining
标 题: 4.3 分类知识(Classification&Clustering)
发信站: 南京大学小百合站 (Wed Dec 12 16:28:19 2001)
----它反映同类事物共同性质的特征型知识和不同事物之间的差异型特征知识。最为典型
的分类方法是基于决策树的分类方法。它是从实例集中构造决策树,是一种有指导的学习
方法。该方法先根据训练子集(又称为窗口)形成决策树。如果该树不能对所有对象给出
正确的分类,那么选择一些例外加入到窗口中,重复该过程一直到形成正确的决策集。最
终结果是一棵树,其叶结点是类名,中间结点是带有分枝的属性,该分枝对应该属性的某
一可能值。最为典型的决策树学习系统是ID3,它采用自顶向下不回溯策略,能保证找到一
个简单的树。算法C4.5和C5.0都是ID3的扩展,它们将分类领域从类别属性扩展到数值型属
性。
----数据分类还有统计、粗糙集(RoughSet)等方法。线性回归和线性辨别分析是典型的
统计模型。为降低决策树生成代价,人们还提出了一种区间分类器。最近也有人研究使用
神经网络方法在数据库中进行分类和规则提取。
--
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.119.36.151]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -