409.txt

来自「This complete matlab for neural network」· 文本代码 · 共 25 行

TXT

25 行

发信人: mining (key), 信区: DataMining
标  题: Re: 我对文本分类问题的几点看法。你一定得看看哟！
发信站: 南京大学小百合站 (Sun Oct 20 13:01:39 2002), 站内信件

我个人认为：要是你的子类别的特征集完全是正交的话，那你的分类准确度能达到100%.
事实上，你提的这个问题存在的可能性几乎就没有，因为我们的语言还没达到这种丰富程
度。如果真如你所说，根本就没有交集，那你可以进一步精炼你的特征集，让它变得更小
。
不知道Wbai这么认为否。
【 在 pxh1018 (耐思) 的大作中提到: 】
:          “对各类别特征子集提取后，再求并集”，如果我有1000个预先定义的类，..
: 
: 类的特征值有3000个，假设对他们求并集，所有的类别没有一个特征值存在交集，则求并
: 
: 集后就有3000000个特征值，并且特征值的数目随着主题类别的增加而增加，所有想问..
: 
: wbAI是怎样解决这个问题的？
: 
: 
: 【 在 WbAI 的大作中提到: 】
: :      本人搞了一段文本分类，有以下体会，与大家分享：
: :     （1）影响分类精度的因素：
: :          1.1  特征提取方法：通常DF方法简单易行，且精度较高。但一般人们都采..
: : 方法，odds ratio方法效果也非常不错。
: :          1.2  分类器算法：精度最高的普遍认为是支持向量机，但简单VSM和朴素

409.txt - 源码说明

本页面展示了「This complete matlab for neural network」中的 409.txt 源码文件，采用文本编程语言编写，共 25 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与complete相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?