📄 92.txt
字号:
发信人: yinxucheng (yxc), 信区: DataMining
标 题: Re: 那位大侠介绍一下Cross-Validation
发信站: 南京大学小百合站 (Tue Jul 8 19:36:32 2003)
[以下内容主要在模式识别的范围中讨论]
Cross-Validation的基本思想为,把已有样本集分为两个子集,用其中一组(训练集
)来训练(设计)分类器,另一组(检验集)用于检验(估计训练好的分类器的泛化错误
),根据检验结果来评估分类器的性能,并调整分类器的相关参数;然后再进行同上的训
练与调整过程。当泛化错误达到理想值时,则得到的分类器为目标分类器。
具体的一个例子,利用三层BP网络来进行人脸与非人脸的识别(人脸检测)。现有人
脸与非人脸样本共1000个,采用Cross-Validation方法,可以这样做,随机挑选900个样本
作为训练集,剩余的100个作为检验集。第一次网络训练完成后,如果检验得到的错误率高
,可以调整网络的相关系数(如隐含层节点的个数),再进行训练;如此往复,直至得到
较理想的检验结果;最后得到的网络分类器就是人脸检测器。
当然,对于训练样本集与检验样本集之间的比例问题,具体情况具体分析;另外,在训
练与检验过程中,该比例关系也是可以变动的。一般认为,它们之间的比例为9:1时,在多
数实际应用中分类器能够取得较好的泛化能力。
同时,Cross-Validation只是一种启发性方法,并不是在任何情况下都有用;有时可能
出现Anti-Cross Validation现象。
欲知更详细、更准确的分析请参看以下文献:
[1] 9.6.2节, in Richard O. Duda, Peter E. Hart and David G. Stork, "Pattern C
lassification ( 2nd ed. )", Wiley Interscience, 2000.
[2] 3.6.2节,in 边肇祺,张学工等,“模式识别(第二版)”,清华大学出版社,2000
.
【 在 jiangcyn 的大作中提到: 】
: 那位大侠用过cross-validation,介绍一下。
: 3x
--
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 218.247.128.213]
※ 修改:.yinxucheng 於 Jul 8 19:40:21 2003 修改本文.[FROM: 218.247.128.213]
※ 修改:.yinxucheng 於 Jul 8 19:42:56 2003 修改本文.[FROM: 218.247.128.213]
※ 修改:.yinxucheng 於 Jul 8 19:48:24 2003 修改本文.[FROM: 218.247.128.213]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -