93.txt
来自「This complete matlab for neural network」· 文本 代码 · 共 19 行
TXT
19 行
发信人: singhoo (tony), 信区: DataMining
标 题: Re: 文本分类特征项的选择?
发信站: 南京大学小百合站 (Mon Sep 23 10:15:22 2002), 站内信件
从信息增益的公式可以看出
它对于每个词IG值的计算使用了所有类别的信息,所以应该只有一个特征集合
互信息MI公式有所不同,先独立计算每个类的特征集合,在求并集,最后还是一个集合
【 在 pxh1018 (耐思) 的大作中提到: 】
: 我想建立一个文本分类模型,通过对训练文本集分词,
: 用信息增益选取特征项,请问是每个分类主题(例如体育类)一个
: 特征项集,还是所有的主题的特征项集是一样的?
:
--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 202.38.197.76]
⌨️ 快捷键说明
复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?