91.txt

来自「This complete matlab for neural network」· 文本代码 · 共 28 行

TXT

28 行

发信人: GzLi (笑梨), 信区: DataMining
标  题: [合集]如何将一个数据集随机的分成两个数据集
发信站: 南京大学小百合站 (Tue Jun  3 21:55:35 2003)

fpzh (fpzh) 于Sat May 24 01:10:15 2003)
提到：

有两个问题向大家请教

1. 对于一组数据，做SVM的Model Selection时，通过训练随机选择的70％的数据、测试
其余30％的数据（只做一次划分，而不像10fold那样训练10次）来估计Validation Per
formance（预测精度或者说推广能力），可行否

2. （1）对于多类数据，这70％的数据如何随机选择？是各类单独采样还是对全体数据
统一采样（后者各类的数据可能不均衡）；（2）采样应采取“取出后不再放入”的方式
，即从数据中随机选出一个样本i，以后不再考虑样本i？


miningboy (找矿男孩) 于Sat May 24 10:58:45 2003)
提到：

选数据的时候如果要保持训练集和测试集中的分布都和原来的相同

可以参考类似十倍交叉验证的取样方法。

当然这种应该属于非重复取样，跳出xi后要将xi删除


【 在 fpzh 的大作中提到: 】

: 有两个问题向大家请教

: 1. 对于一组数据，做SVM的Model Selection时，通过训练随机选择的70％的数据、

91.txt - 源码说明

本页面展示了「This complete matlab for neural network」中的 91.txt 源码文件，采用文本编程语言编写，共 28 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与complete相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?