:将K—means算法引入到朴素贝叶斯分类研究中,提出一种基于K—means的朴素贝叶斯分类算法。首先用K— me.arks算法对原始数据集中的完整数据子集进行聚类,计算缺失数据子集中的每条记录与 个簇重心之间的相似度,把记 录赋给距离最近的一个簇,并用该簇相应的属性均值来填充记录的缺失值,然后用朴素贝叶斯分类算法对处理后的数据 集进行分类。实验结果表明,与朴素贝叶斯相比,基于K—means思想的朴素贝叶斯算法具有较高的分类准确率。
上传时间: 2017-08-18
上传用户:banyou
批处理感知器算法的代码matlab w1=[1,0.1,1.1;1,6.8,7.1;1,-3.5,-4.1;1,2.0,2.7;1,4.1,2.8;1,3.1,5.0;1,-0.8,-1.3; 1,0.9,1.2;1,5.0,6.4;1,3.9,4.0]; w2=[1,7.1,4.2;1,-1.4,-4.3;1,4.5,0.0;1,6.3,1.6;1,4.2,1.9;1,1.4,-3.2;1,2.4,-4.0; 1,2.5,-6.1;1,8.4,3.7;1,4.1,-2.2]; w3=[1,-3.0,-2.9;1,0.5,8.7;1,2.9,2.1;1,-0.1,5.2;1,-4.0,2.2;1,-1.3,3.7;1,-3.4,6.2; 1,-4.1,3.4;1,-5.1,1.6;1,1.9,5.1]; figure; plot(w3(:,2),w3(:,3),'ro'); hold on; plot(w2(:,2),w2(:,3),'b+'); W=[w2;-w3];%增广样本规范化 a=[0,0,0]; k=0;%记录步数 n=1; y=zeros(size(W,2),1);%记录错分的样本 while any(y<=0) k=k+1; y=a*transpose(W);%记录错分的样本 a=a+sum(W(find(y<=0),:));%更新a if k >= 250 break end end if k<250 disp(['a为:',num2str(a)]) disp(['k为:',num2str(k)]) else disp(['在250步以内没有收敛,终止']) end %判决面:x2=-a2*x1/a3-a1/a3 xmin=min(min(w1(:,2)),min(w2(:,2))); xmax=max(max(w1(:,2)),max(w2(:,2))); x=xmin-1:xmax+1;%(xmax-xmin): y=-a(2)*x/a(3)-a(1)/a(3); plot(x,y)
上传时间: 2016-11-07
上传用户:a1241314660
K-Means算法是最古老也是应用最广泛的聚类算法,它使用质心定义原型,质心是一组点的均值,通常该算法用于n维连续空间中的对象。 K-Means算法流程 step1:选择K个点作为初始质心 step2:repeat 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 until 质心不在变化 例如下图的样本集,初始选择是三个质心比较集中,但是迭代3次之后,质心趋于稳定,并将样本集分为3部分 我们对每一个步骤都进行分析 step1:选择K个点作为初始质心 这一步首先要知道K的值,也就是说K是手动设置的,而不是像EM算法那样自动聚类成n个簇 其次,如何选择初始质心 最简单的方式无异于,随机选取质心了,然后多次运行,取效果最好的那个结果。这个方法,简单但不见得有效,有很大的可能是得到局部最优。 另一种复杂的方式是,随机选取一个质心,然后计算离这个质心最远的样本点,对于每个后继质心都选取已经选取过的质心的最远点。使用这种方式,可以确保质心是随机的,并且是散开的。 step2:repeat 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 until 质心不在变化 如何定义最近的概念,对于欧式空间中的点,可以使用欧式空间,对于文档可以用余弦相似性等等。对于给定的数据,可能适应与多种合适的邻近性度量。
上传时间: 2018-11-27
上传用户:1159474180
描述了NTC使用B值计算出实际温度与输出的电压之间的关系。
标签: ntc计算
上传时间: 2022-06-15
上传用户:
21世纪大学新型参考教材系列 集成电路B 荒井
上传时间: 2013-04-15
上传用户:eeworm
家电维修(最基础的教程B)1-20.Torrent
上传时间: 2013-06-10
上传用户:eeworm
jk-b交通信号控制机原理图
上传时间: 2013-07-13
上传用户:eeworm
专辑类-实用电子技术专辑-385册-3.609G jk-b交通信号控制机原理图-1.3M.zip
上传时间: 2013-08-02
上传用户:zhf1234
专辑类-电子基础类专辑-153册-2.20G 21世纪大学新型参考教材系列-集成电路B-荒井-159页-2.8M.pdf
上传时间: 2013-05-16
上传用户:pkkkkp
三次B样条曲线源代码,C语言编写的三次B样条曲线源代码,希望大家喜欢。
标签:
上传时间: 2013-07-13
上传用户:chengli008