46.txt

来自「This complete matlab for neural network」· 文本 代码 · 共 36 行

TXT
36
字号
发信人: GzLi (笑梨), 信区: DataMining
标  题: [合集]有为有那位对当前文本分类比较了解的说两句
发信站: 南京大学小百合站 (Sun Oct 20 23:34:44 2002), 站内信件

sdvictor (大家好) 于Fri Oct 18 10:50:25 2002提到:

现在文本分类做到了什么程度,准确率和召回率国际上的说法到了多少?这个领域常用
的方法是什么方法,还有没有进一步研究的必要?


tyqqre (tyqqre) 于Fri Oct 18 20:14:37 2002)
提到:

基于向量空间模型的方法:

naive bayes, knn, vsm



WbAI (wbAI) 于Sat Oct 19 13:47:55 2002)
提到:

    文本分类是一个较热门的研究方向,通常有两条路线对其分类:

    1,采用规则分类

    2,基于统计方法的分类

    前者研究的人较少,应用也少,精度也不高。

    第2种方法采用的人较多,成熟的方法也较多,分类精度目前最高的得数支持向量机了
吧。但实现复杂,时间耗费较大。其次就是 typre所说的那几种用得较多。

   通常精确率和召回率都在85左右。

   文本分类的进一步研究空间还是有的。比如:现在的分类都是基于统计的,统计词频,
计算信息赢取等等。。。。。。

  那么,能不能基于语义分类呢?能不能进一步提高文本分类精度呢?等等,但是进一步的
研究方向哟。

  呵呵,以上为本人一家之见,希望大家补充




⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?