945.txt

来自「This complete matlab for neural network」· 文本 代码 · 共 24 行

TXT
24
字号
发信人: tyqqre (tyqqre), 信区: DataMining
标  题: Re: 关于naive bayes的问题
发信站: 南京大学小百合站 (Mon Sep 16 10:51:44 2002)

我的理解是:

p(wi|cj)是在训练例集上求得的,也就是说,只要训练例集不变,这个值应该是固定的。

而÷来了一个需要分类的新文档di

在计算p(cj|di)的时候,nid次方的这个nid是在这个新文档di中wi出现的次数。

所以nid越大,p(wi|cj)的nid次方就越小。


这样能不能说,用这种方法只能比较同一篇文章属于不同类别的概率,

而不能比较不同文章属于同一类别的概率。

【 在 singhoo 的大作中提到: 】

: 但是p(wi|cj)会变大阿

: 你的前提条件是wi出现多次

: 本来出现一次p(wi|cj)=0.8,不计算次方

: 出现2次,p(wi|cj)=0.9,平方后是0.81

: 变小了吗?


--

※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 211.99.42.120]

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?