📄 27.txt
字号:
发信人: NAOMIELIE (雁来红), 信区: DataMining
标 题: FD ML Seminar Report 2 [from 日月光华]
发信站: 南京大学小百合站 (Fri Mar 7 14:22:34 2003)
发信人: ffseven (听过这么差的讨论班么), 信区: FDU_C.S.
标 题: Machine Learning讨论班Patch 2.0
发信站: 日月光华 (2003年03月06日22:54:54 星期四), 站内信件
5. 样本空间的搜索以及General/Specific关系的定义
根据上面的描述,概念学习可以看作是在假设空间内的搜索问题。为了更好地引导
搜索,提高搜索效率,就定义了两个假设h1和h2之间的General/Specific关系。
如果假设h1比假设h2更General,那么满足假设h1的实例一定会多于满足假设h2的实
例。从集合的角度来看,h1所对应的子集包含h2对应的子集。
6. FIND-S 算法
思想就是在假设空间中找出满足训练样本集所有正例的最specific的假设。
7. Version Space
再对假设空间分析一下,我们可以发现满足训练样本集的假设会有很多。
从集合的角度讲,只要某一个假设所对应的子集满足这样的条件:训练样本集中的所
有正例都属于该子集并且所有反例都不属于该子集,那么这个假设就在训练样本集上
与目标概念一致。所有这样的假设加在一起就构成了Version Space,显然他要比原
来的假设空间小。
8. G Boundary & S Boudary
那个有些小问题的定理利用general和specific的关系,说明version space是可以
用一个上界和下界来确定的。Candidate-eliminate算法就利用这个特点,最终找出这
个上下界,从而得到所有与训练样本集一致的假设。
如果训练数据足够多,上下界会收敛,逐渐逼近目标假设。
--
雪花天上飘 魔石雪里埋
拂去身上泥 还是石一块
※ 来源:·日月光华 bbs.fudan.edu.cn·[FROM: 10.11.1.127]
--
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 218.30.19.115]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -