📄 5.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [合集]请教关于聚类问题:
发信站: 南京大学小百合站 (Thu Mar 13 11:15:54 2003)
mytruth (heart) 于Mon Feb 17 23:31:37 2003)
提到:
近来在做一个聚类算法,在聚类的过程中,需要知道聚类的个数。但是聚类问题事先是
不知道number of clusters.
这该怎么办呢?另外,如果在开始的时候任意取一些值,得到几种聚类的结果,最后又
要用什么办法来衡量到底哪个值是最佳的呢?
其他的聚类方法是不是也有这样的问题? 这个类的个数是怎么确定的呢?
谢谢!焦急地等待回复!
aaahchi (aaahchi) 于Tue Feb 18 18:25:55 2003)
提到:
有个AutoClass据说能自动发现聚类的个数。也有一些文章讲k-means里面自动选k。
要看你的算法是什么,具体数据的类型和分布。有些应用里面其实聚多少类都是合理
的。
评价聚类效果我用过entropy,好像precision/recall也可以。
【 在 mytruth (heart) 的大作中提到: 】
: 近来在做一个聚类算法,在聚类的过程中,需要知道聚类的个数。但是聚类问题事先是
: 不知道number of clusters.
: 这该怎么办呢?另外,如果在开始的时候任意取一些值,得到几种聚类的结果,最后又
: 要用什么办法来衡量到底哪个值是最佳的呢?
: 其他的聚类方法是不是也有这样的问题? 这个类的个数是怎么确定的呢?
: 谢谢!焦急地等待回复!
nthgue5t (SIGSleep) 于Wed Feb 19 17:50:38 2003)
提到:
【 在 mytruth 的大作中提到: 】
: 近来在做一个聚类算法,在聚类的过程中,需要知道聚类的个数。但是聚类问题事先..
: 不知道number of clusters.
: 这该怎么办呢?
>>> Using another cluster method.
另外,如果在开始的时候任意取一些值,得到几种聚类的结果,最后又
: 要用什么办法来衡量到底哪个值是最佳的呢?
>>> The simplest solution: comparing your results with the "truth" :P
: 其他的聚类方法是不是也有这样的问题?
>>> Some yes, some no
这个类的个数是怎么确定的呢?
>>> E.g. using domain knowledge
: 谢谢!焦急地等待回复!
mytruth (heart) 于Thu Feb 20 23:15:49 2003)
提到:
对于实际的数据,我们又是如何知道实际的情况呢
【 在 nthgue5t (SIGSleep) 的大作中提到: 】
:
: 【 在 mytruth 的大作中提到: 】
: 另外,如果在开始的时候任意取一些值,得到几种聚类的结果,最后又
: 这个类的个数是怎么确定的呢?
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -