⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 409.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: mining (key), 信区: DataMining
标  题: Re: 我对文本分类问题的几点看法。你一定得看看哟!
发信站: 南京大学小百合站 (Sun Oct 20 13:01:39 2002), 站内信件

我个人认为:要是你的子类别的特征集完全是正交的话,那你的分类准确度能达到100%.
事实上,你提的这个问题存在的可能性几乎就没有,因为我们的语言还没达到这种丰富程
度。如果真如你所说,根本就没有交集,那你可以进一步精炼你的特征集,让它变得更小
不知道Wbai这么认为否。
【 在 pxh1018 (耐思) 的大作中提到: 】
:          “对各类别特征子集提取后,再求并集”,如果我有1000个预先定义的类,..
: 
: 类的特征值有3000个,假设对他们求并集,所有的类别没有一个特征值存在交集,则求并
: 
: 集后就有3000000个特征值,并且特征值的数目随着主题类别的增加而增加,所有想问..
: 
: wbAI是怎样解决这个问题的?
: 
: 
: 【 在 WbAI 的大作中提到: 】
: :      本人搞了一段文本分类,有以下体会,与大家分享:
: :     (1)影响分类精度的因素:
: :          1.1  特征提取方法:通常DF方法简单易行,且精度较高。但一般人们都采..
: : 方法,odds ratio方法效果也非常不错。
: :          1.2  分类器算法:精度最高的普遍认为是支持向量机,但简单VSM和朴素

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -