922.txt

来自「This complete matlab for neural network」· 文本代码 · 共 23 行

TXT

23 行

发信人: tyqqre (tyqqre), 信区: DataMining
标  题: Re: 关于naive bayes的问题
发信站: 南京大学小百合站 (Sat Sep 14 22:30:29 2002)

请问，

有人能不能解释一下multinomial模型的合理性吗？

例如：

在计算后验概率的时候，p(wi|cj)还要nid（即词wi在新文档d中出现的次数）次方，是否
表明如果词wi在新文档d中出现的次数越多，则后验概率越小？因为p(wi|cj）<=1,再来个
次方不就更小了吗？而且nid越大幂值就越小。


楼下的这位朋友的问题也很难找到答案，有人有这方面的资料吗？

【 在 singhoo 的大作中提到: 】

: 打算使用简单Bayes算法作为文本分类器，但是对于文档的特征提取有些疑问

: 有的使用multinomial模型，即计算词频，不计算文档频率

: 使用TF/IDF。即计算词频，也计算文档频率

: 到底使用哪个模型比较好？如果使用TF/IDF，在使用Bayes计算的时候如何使用

: TF/IDF得到的权值？THX!


--

※ 来源:．南京大学小百合站 http://bbs.nju.edu.cn [FROM: 211.99.42.120]

922.txt - 源码说明

本页面展示了「This complete matlab for neural network」中的 922.txt 源码文件，采用文本编程语言编写，共 23 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与complete相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?