📄 93.txt
字号:
发信人: singhoo (tony), 信区: DataMining
标 题: Re: 文本分类特征项的选择?
发信站: 南京大学小百合站 (Mon Sep 23 10:15:22 2002), 站内信件
从信息增益的公式可以看出
它对于每个词IG值的计算使用了所有类别的信息,所以应该只有一个特征集合
互信息MI公式有所不同,先独立计算每个类的特征集合,在求并集,最后还是一个集合
【 在 pxh1018 (耐思) 的大作中提到: 】
: 我想建立一个文本分类模型,通过对训练文本集分词,
: 用信息增益选取特征项,请问是每个分类主题(例如体育类)一个
: 特征项集,还是所有的主题的特征项集是一样的?
:
--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 202.38.197.76]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -