406.txt

来自「This complete matlab for neural network」· 文本 代码 · 共 19 行

TXT
19
字号
发信人: pxh1018 (耐思), 信区: DataMining
标  题: Re: 我对文本分类问题的几点看法。你一定得看看哟!
发信站: 南京大学小百合站 (Sun Oct 20 11:17:29 2002)

         “对各类别特征子集提取后,再求并集”,如果我有1000个预先定义的类,每个

类的特征值有3000个,假设对他们求并集,所有的类别没有一个特征值存在交集,则求并

集后就有3000000个特征值,并且特征值的数目随着主题类别的增加而增加,所有想问一下

wbAI是怎样解决这个问题的?



【 在 WbAI 的大作中提到: 】

:      本人搞了一段文本分类,有以下体会,与大家分享:

:     (1)影响分类精度的因素:

:          1.1  特征提取方法:通常DF方法简单易行,且精度较高。但一般人们都采..
: 方法,odds ratio方法效果也非常不错。

:          1.2  分类器算法:精度最高的普遍认为是支持向量机,但简单VSM和朴素

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?