93.txt

来自「This complete matlab for neural network」· 文本 代码 · 共 19 行

TXT
19
字号
发信人: singhoo (tony), 信区: DataMining
标  题: Re: 文本分类特征项的选择?
发信站: 南京大学小百合站 (Mon Sep 23 10:15:22 2002), 站内信件

从信息增益的公式可以看出
它对于每个词IG值的计算使用了所有类别的信息,所以应该只有一个特征集合

互信息MI公式有所不同,先独立计算每个类的特征集合,在求并集,最后还是一个集合

【 在 pxh1018 (耐思) 的大作中提到: 】
:    我想建立一个文本分类模型,通过对训练文本集分词,
: 用信息增益选取特征项,请问是每个分类主题(例如体育类)一个
: 特征项集,还是所有的主题的特征项集是一样的?
: 


--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 202.38.197.76]

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?