📄 3.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [合集]怎么那么多学科里都有讲到聚类?
发信站: 南京大学小百合站 (Mon Jul 8 22:29:14 2002), 站内信件
geangel (geangel) 于Sun Jul 7 10:17:24 2002)
提到:
老板让偶研究聚类,偶连门槛都摸不到。
偶一查资料,老天,
统计学、模式识别、数据挖掘……怎么那么多学科里都有讲到聚类?
这些学科里的聚类有什么区别?
又分别有那么多的方法,
什么传递闭包的东东、编网法、最大树法是统计里的吧,
K-MEANS、C-MEANS,
BIRCH、CURE、DBSCAN、OPTICS、CLIQUE是数据挖掘里的吧。
它们之间有什么区别?怎么有这么多方法?
偶都搞糊涂了。
能给俺指点一下吗?
chdq135 (阿权) 于Sun Jul 7 10:20:45 2002提到:
you shoud read the book DATAMING: concepts and technologied by Han jiawei
this book will give u some basic ideas.
chdq135 (阿权) 于Sun Jul 7 10:21:58 2002提到:
其实,他们的原理都是一样的。只是应用在不同的领域。医学、心里学、等等
不仅仅是计算机、数学。
armen (安静地做一个俗人) 于Sun Jul 7 10:55:36 2002提到:
都是对数据进行处理
有什么不一样呢?呵呵
geangel (geangel) 于Sun Jul 7 15:00:38 2002)
提到:
偶已经read了,看了个大概,
可是那么多方法,应该研究哪个呢?
什么传递闭包的东东、编网法、最大树法、 K-MEANS、C-MEANS、 BIRCH、CURE、DBSCAN、
OPTICS、CLIQUE,这些方法有关联吗?
郁闷中。
imaniu (井底之蛙) 于Sun Jul 7 20:45:46 2002提到:
自己编程吧,从最简单的做起,从源头上去重新思考,
然后再参考一些新进展,也许这样效果更好。
GzLi (笑梨) 于Mon Jul 8 00:18:03 2002提到:
首先我没有研究过,但将来可能涉及,很感兴趣。
从上面看来,几个术语
我认为1)研究的角度不同、比如统计角度、神经网络角度、其它数学角度
2)应用的领域不同、这个领域不是什么医学的,而是数据类型不同可能方法也不同。
比如二值型、连续型、离散型等
3)方法的体系不同,不如一个人提出一种方法,然后下面的人就在基础上改进,
就有不同方法
所以你从你最感兴趣的,跟课题最相关的方法入手,编几个程序实现一下,
就逐渐弄清了。
而且有些东西可能很老了,有不可克服的障碍。比如统计学方面的东东。
我认为,作东西还是从机器学习的角度开始然后应用到数据挖掘的对象上去的好。
geangel (天使想飞) 于Mon Jul 8 10:18:11 2002)
提到:
谢谢大家,尤其谢谢斑竹。
虽然偶不喜欢数据挖掘,不过很感谢这个版。
GzLi (笑梨) 于Mon Jul 8 10:20:05 2002提到:
我是作算法的,不过在数据挖掘中可以找到应用和问题。因为DM是一个较新的领域。
所以大家多来看看吧。
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -