⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 57.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: GzLi (笑梨), 信区: DataMining
标  题: [合集]关于聚类
发信站: 南京大学小百合站 (Sun Nov 17 00:23:00 2002), 站内信件

ttux (tux) 于Mon Apr 22 08:52:30 2002)
提到:

偶最近有个问题:是否可以通过用数学逼近的方法(如小波等)来描述每一个cluster,

从而为进一步的预测提供了可能,不知道这样的做法复杂度在多少阿?请教.

fervvac (高远) 于Mon Apr 22 09:29:09 2002提到:

Can you elaborate on this?

At the first sight, this seems not nature. Most cluster definitions are based
on distance or density in the original space, not on the frequent domain. For
example, two clusters (one dimensional) might be of the same shape, but with 
different offsex in the x-axis, so they only differ in the phases. Moreoever, 
if you have a fairly accurate approximation, you will include high-frequency
component, which in many case is regarded as noise.

Anyway, there may be a solution there.

【 在 ttux (tux) 的大作中提到: 】
: 
: 偶最近有个问题:是否可以通过用数学逼近的方法(如小波等)来描述每一个cluster,
: 从而为进一步的预测提供了可能,不知道这样的做法复杂度在多少阿?请教.


carayang (管理很重要) 于Wed Nov 13 16:52:02 2002提到:

聚类的算法看了一些,我的问题在于:聚类完成后,怎样应用聚类的结果对未来的数据(已
知某些条件)进行预测呢.是不是还要用到"分类和预测"呢?那么聚类还有什么大用处呢?


GzLi (笑梨) 于Wed Nov 13 20:41:54 2002提到:

比如 一篮子水果,有两种不知名的水果,比如是苹果和梨子,而你不认识,
你通过聚类分为两类
发现一类(苹果)有这种特性,比如红色的、形状象饼、中间是大的、等等
而另一类(梨子)具有这种特性,黄色、下大上小、等等。
那么一个未知数据来了,看看他们的这些特性,就可以分类了。

in a word, clustering can make you know the characteristic of the 
research object.

【 在 carayang (管理很重要) 的大作中提到: 】
: 聚类的算法看了一些,我的问题在于:聚类完成后,怎样应用聚类的结果对未来的数据(已
: 知某些条件)进行预测呢.是不是还要用到"分类和预测"呢?那么聚类还有什么大用处呢?


carayang (管理很重要) 于Thu Nov 14 11:25:47 2002)
提到:

谢谢。

这个我有点理解了,但是,对于那些非离散的数据怎么用聚类呢?

比方说斑竹所作的股票预测,你要预测的是某一个数值而不是性质,该怎么办呢?


【 在 GzLi 的大作中提到: 】

: 比如 一篮子水果,有两种不知名的水果,比如是苹果和梨子,而你不认识,

: 你通过聚类分为两类

: 发现一类(苹果)有这种特性,比如红色的、形状象饼、中间是大的、等等

: 而另一类(梨子)具有这种特性,黄色、下大上小、等等。

: 那么一个未知数据来了,看看他们的这些特性,就可以分类了。

: in a word, clustering can make you know the characteristic of the 

: research object.

: 【 在 carayang (管理很重要) 的大作中提到: 】



francois (断玉) 于Thu Nov 14 11:59:22 2002)
提到:

首先引用《数据挖掘:概念与技术》第8.1节的一段话:


“聚类的典型应用是什么?”在商业上,聚类能帮助市场分析人员从客户基本库中发现不
同的客户群,并且用购买模式来刻画不同的客户群的特征。在生物学上,聚类能用于推导
植物和动物的分类,对基因进行分类,获得对种群中固有结构的认识。聚类在地球观测数
据库中相似地区的确定,汽车保险持有者的分组,及根据房子的类型,价值,和地理位置
对一个城市中房屋的分组上也可以发挥作用。聚类也能用于对Web上的文档进行分类,以发
现信息。作为一个数据挖掘的功能,聚类分析能作为一个独立的工具来获得数据分布的情
况,观察每个簇的特点,集中对特定的某些簇作进一步的分析。此外,聚类分析可以作为
其他算法(如分类等)的预处理步骤,这些算法再在生成的簇上进行处理。


我的感觉是聚类应该基本上算是一种预处理,聚类的结果则是为进一步分析或分类作准备
。因为聚类本身是一种Unsupervised Learning,实例被聚到哪一个类完全取决于你给定的
距离函数,聚类的结果是否符合应用的期望或者客观的事实都无法确定,因此直接用聚类
的结果(类中心、类的特征等)来进行分类和预测是不合适的,中间应该加上人的参与才
是比较合理的做法。


【 在 GzLi 的大作中提到: 】

: 比如 一篮子水果,有两种不知名的水果,比如是苹果和梨子,而你不认识,

: 你通过聚类分为两类

: 发现一类(苹果)有这种特性,比如红色的、形状象饼、中间是大的、等等

: 而另一类(梨子)具有这种特性,黄色、下大上小、等等。

: 那么一个未知数据来了,看看他们的这些特性,就可以分类了。

: in a word, clustering can make you know the characteristic of the 

: research object.

: 【 在 carayang (管理很重要) 的大作中提到: 】



⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -