📄 46.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [合集]有为有那位对当前文本分类比较了解的说两句
发信站: 南京大学小百合站 (Sun Oct 20 23:34:44 2002), 站内信件
sdvictor (大家好) 于Fri Oct 18 10:50:25 2002提到:
现在文本分类做到了什么程度,准确率和召回率国际上的说法到了多少?这个领域常用
的方法是什么方法,还有没有进一步研究的必要?
tyqqre (tyqqre) 于Fri Oct 18 20:14:37 2002)
提到:
基于向量空间模型的方法:
naive bayes, knn, vsm
WbAI (wbAI) 于Sat Oct 19 13:47:55 2002)
提到:
文本分类是一个较热门的研究方向,通常有两条路线对其分类:
1,采用规则分类
2,基于统计方法的分类
前者研究的人较少,应用也少,精度也不高。
第2种方法采用的人较多,成熟的方法也较多,分类精度目前最高的得数支持向量机了
吧。但实现复杂,时间耗费较大。其次就是 typre所说的那几种用得较多。
通常精确率和召回率都在85左右。
文本分类的进一步研究空间还是有的。比如:现在的分类都是基于统计的,统计词频,
计算信息赢取等等。。。。。。
那么,能不能基于语义分类呢?能不能进一步提高文本分类精度呢?等等,但是进一步的
研究方向哟。
呵呵,以上为本人一家之见,希望大家补充
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -