📄 k-均值聚类算法- 月华 - 新浪blog.htm
字号:
<TABLE width="100%">
<TBODY>
<TR height=12>
<TD></TD></TR></TBODY></TABLE>
<DIV id=commentItem48e01819010003qp>
<TABLE class="sysHand item" cellSpacing=0 cellPadding=0
align=center>
<TBODY>
<TR class=iTitle
onclick="hide('commentItemBody48e01819010003qp2');swap('commentItemTitle48e01819010003qp2','className','iUp','iDown')">
<TD class=iUp id=commentItemTitle48e01819010003qp2>
<DIV class=sysBr500>[匿名] 路人甲</DIV></TD></TR></TBODY></TABLE>
<DIV id=commentItemBody48e01819010003qp2>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD align=middle>
<TABLE class=itemBody cellSpacing=0 cellPadding=0
align=center border=0>
<TBODY>
<TR>
<TD class=iPubdate align=right>2006-05-24
11:48:23</TD></TR>
<TR>
<TD class=iText>
<DIV
class=sysBr476>先记录下了,回去慢慢看<BR><BR>对了,你做的聚类算法只有k均值吗?<BR>我最近在做关于层次聚类的算法,只有个思路,还没有实现<BR><BR>输入:<BR>D={t1,t2....tn}
//成员集合<BR>A //表示成员之间距离的邻接矩阵<BR>输出:<BR>DE
//以有序三元组形式表示的谱系表<BR>平均连接算法:<BR>d=0;<BR>k=n;<BR>K={{t1},...,{tn}};<BR>DE={<d,k,K>}
;//在初始谱系图表中,每一个成员均为一个单独的簇<BR><BR>重复<BR>old
k=k;<BR>d=d+0.5<BR>对于每对属于k的Ki,Kj;<BR>ave=ti,tj的平均距离(ti属于Ki,tj属于Kj);<BR>如果ave<=d,则<BR>K={K-{Ki}-{Kj}}U{Ki
U kj};<BR>k=old k-1;<BR>DE=DE
U<d,k,K>;//新簇集加入谱系图中<BR>直到
k=1结束<BR><BR>恩,大致就是这样,算法是书上找来的,还在研究中,因为聚类这方面还不是很懂。不知道这个算法用来做层次聚类可不可行...<BR>如果有做层次聚类算法的话,帮忙指点下
^.^</DIV></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE></DIV></DIV>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD class=iBottom></TD></TR></TBODY></TABLE>
<TABLE width="100%">
<TBODY>
<TR height=12>
<TD></TD></TR></TBODY></TABLE>
<DIV id=commentItem48e01819010003qp>
<TABLE class="sysHand item" cellSpacing=0 cellPadding=0
align=center>
<TBODY>
<TR class=iTitle
onclick="hide('commentItemBody48e01819010003qp3');swap('commentItemTitle48e01819010003qp3','className','iUp','iDown')">
<TD class=iUp id=commentItemTitle48e01819010003qp3>
<DIV class=sysBr500><A
href="http://blog.sina.com.cn/u/1222645785"><U>[匿名]
月华</U></A></DIV></TD></TR></TBODY></TABLE>
<DIV id=commentItemBody48e01819010003qp3>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD align=middle>
<TABLE class=itemBody cellSpacing=0 cellPadding=0
align=center border=0>
<TBODY>
<TR>
<TD class=iPubdate align=right>2006-05-24
12:48:30</TD></TR>
<TR>
<TD class=iText>
<DIV class=sysBr476>层次距离簇之间的距离有单连接(single
link),平均连接(average link)和全连接(complete
link),最常用的是单连接和全连接。你提到的实际上是平均连接法。<BR>本人以前用层次聚类法做过文本聚类,与一般的层次聚类算法相比,相似度计算方法稍有不同。最近把它改成了一般的层次聚类法,包含以上的三个连接。距离域值的调整与你提到的稍有不同,是基于已知距离的。<BR>与k-means相比,运算有些慢。算法正在优化过程中。过些天贴出来。先忙完手头上的事情再说</DIV></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE></DIV></DIV>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD class=iBottom></TD></TR></TBODY></TABLE>
<TABLE width="100%">
<TBODY>
<TR height=12>
<TD></TD></TR></TBODY></TABLE>
<DIV id=commentItem48e01819010003qp>
<TABLE class="sysHand item" cellSpacing=0 cellPadding=0
align=center>
<TBODY>
<TR class=iTitle
onclick="hide('commentItemBody48e01819010003qp4');swap('commentItemTitle48e01819010003qp4','className','iUp','iDown')">
<TD class=iUp id=commentItemTitle48e01819010003qp4>
<DIV class=sysBr500>[匿名] 路人甲</DIV></TD></TR></TBODY></TABLE>
<DIV id=commentItemBody48e01819010003qp4>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD align=middle>
<TABLE class=itemBody cellSpacing=0 cellPadding=0
align=center border=0>
<TBODY>
<TR>
<TD class=iPubdate align=right>2006-05-25
09:48:24</TD></TR>
<TR>
<TD class=iText>
<DIV
class=sysBr476>那三种计算距离的方法会对算法效率有很大影响吗?<BR><BR>很期待你的算法^.^
</DIV></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE></DIV></DIV>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD class=iBottom></TD></TR></TBODY></TABLE>
<TABLE width="100%">
<TBODY>
<TR height=12>
<TD></TD></TR></TBODY></TABLE>
<DIV id=commentItem48e01819010003qp>
<TABLE class="sysHand item" cellSpacing=0 cellPadding=0
align=center>
<TBODY>
<TR class=iTitle
onclick="hide('commentItemBody48e01819010003qp5');swap('commentItemTitle48e01819010003qp5','className','iUp','iDown')">
<TD class=iUp id=commentItemTitle48e01819010003qp5>
<DIV class=sysBr500><A
href="http://blog.sina.com.cn/u/1222645785"><U>月华</U></A></DIV></TD></TR></TBODY></TABLE>
<DIV id=commentItemBody48e01819010003qp5>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD align=middle>
<TABLE class=itemBody cellSpacing=0 cellPadding=0
align=center border=0>
<TBODY>
<TR>
<TD class=iPubdate align=right>2006-05-25
12:14:58</TD></TR>
<TR>
<TD class=iText>
<DIV
class=sysBr476>那三种计算距离的方法主要不是效率问题,是计算精度问题,与实际符合情况的问题</DIV></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE></DIV></DIV>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD class=iBottom></TD></TR></TBODY></TABLE>
<TABLE width="100%">
<TBODY>
<TR height=12>
<TD></TD></TR></TBODY></TABLE>
<DIV id=commentItem48e01819010003qp>
<TABLE class="sysHand item" cellSpacing=0 cellPadding=0
align=center>
<TBODY>
<TR class=iTitle
onclick="hide('commentItemBody48e01819010003qp6');swap('commentItemTitle48e01819010003qp6','className','iUp','iDown')">
<TD class=iUp id=commentItemTitle48e01819010003qp6>
<DIV class=sysBr500><A
href="http://blog.sina.com.cn/u/1235362472"><U>hongxiulee402</U></A></DIV></TD></TR></TBODY></TABLE>
<DIV id=commentItemBody48e01819010003qp6>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD align=middle>
<TABLE class=itemBody cellSpacing=0 cellPadding=0
align=center border=0>
<TBODY>
<TR>
<TD class=iPubdate align=right>2006-05-29
10:51:30</TD></TR>
<TR>
<TD class=iText>
<DIV
class=sysBr476>我现在在写一篇关于瓷砖分类的论文.用到k均值算法,但我调试几次,没成功,希望得到你的帮助.我的邮箱<A
href="mailto:hongxiu17@126.com.">hongxiu17@126.com.</A><BR>盼回复,谢谢</DIV></TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE></DIV></DIV>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD class=iBottom></TD></TR></TBODY></TABLE>
<TABLE width="100%">
<TBODY>
<TR height=12>
<TD></TD></TR></TBODY></TABLE>
<DIV id=commentItem48e01819010003qp>
<TABLE class="sysHand item" cellSpacing=0 cellPadding=0
align=center>
<TBODY>
<TR class=iTitle
onclick="hide('commentItemBody48e01819010003qp7');swap('commentItemTitle48e01819010003qp7','className','iUp','iDown')">
<TD class=iUp id=commentItemTitle48e01819010003qp7>
<DIV class=sysBr500>[匿名]
testest</DIV></TD></TR></TBODY></TABLE>
<DIV id=commentItemBody48e01819010003qp7>
<TABLE class=item cellSpacing=0 cellPadding=0 align=center>
<TBODY>
<TR>
<TD align=middle>
<TABLE class=itemBody cellSpacing=0 cellPadding=0
align=center border=0>
<TBODY>
<TR>
<TD class=iPubdate align=right>2006-05-30
17:20:36</TD></TR>
<TR>
<TD class=iText>
<DIV
class=sysBr476>拿你的程序试了下<BR>pos.txt文件中的数据是一些数,以空格分开,比如25
25 25 26 26 26 28 28 28 94 94 94 174 174
17等等大概400多个这样的数...<BR>运行程序,选择single Link(0)
只生成了三个文件,域值.txt<BR>cengci1.txt和cengci7.txt<BR>域值文件中的第一个结果是:<BR>6277438562204192500000000000000000000000000000000000000000000000000.000000<BR>cengci1.txt中的数据是:
<BR>0 15 0 7 14 13 12 11 10 9 8 1 6 5 4 3
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -