决策树C45,用matlab编写的,数据挖掘算法。
上传时间: 2014-01-10
上传用户:dianxin61
决策树cart,用matlab编写的,数据挖掘算法。
上传时间: 2016-12-08
上传用户:tyler
FP树的JAVA版本,分布式数据挖掘算法可能会用到.
上传时间: 2014-01-15
上传用户:royzhangsz
网络提供了海量的共享资源,人们需要从网络上搜索出自己感兴趣的信息,由此产生了Web挖掘的问题。Web挖掘就是借用数据挖掘技术来实现的。Web挖掘主要是文本信息的挖掘,本文主要研究了实现文本挖掘的层次凝聚类算法,对于传统的算法存在的问题,提出了改进的算法,研究了相似度值对整个算法过程的影响,设计了一个动态改变相似度值的计算公式。
上传时间: 2014-01-05
上传用户:banlangen
Aprioir算法的的Vc++的简单实现。所采用的数据集在程序中的到体现,没有采用数据库。适合初学数据挖掘的读者。
上传时间: 2016-08-02
上传用户:13215175592
K-Means算法是最古老也是应用最广泛的聚类算法,它使用质心定义原型,质心是一组点的均值,通常该算法用于n维连续空间中的对象。 K-Means算法流程 step1:选择K个点作为初始质心 step2:repeat 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 until 质心不在变化 例如下图的样本集,初始选择是三个质心比较集中,但是迭代3次之后,质心趋于稳定,并将样本集分为3部分 我们对每一个步骤都进行分析 step1:选择K个点作为初始质心 这一步首先要知道K的值,也就是说K是手动设置的,而不是像EM算法那样自动聚类成n个簇 其次,如何选择初始质心 最简单的方式无异于,随机选取质心了,然后多次运行,取效果最好的那个结果。这个方法,简单但不见得有效,有很大的可能是得到局部最优。 另一种复杂的方式是,随机选取一个质心,然后计算离这个质心最远的样本点,对于每个后继质心都选取已经选取过的质心的最远点。使用这种方式,可以确保质心是随机的,并且是散开的。 step2:repeat 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 until 质心不在变化 如何定义最近的概念,对于欧式空间中的点,可以使用欧式空间,对于文档可以用余弦相似性等等。对于给定的数据,可能适应与多种合适的邻近性度量。
上传时间: 2018-11-27
上传用户:1159474180
数据结构常用算法程序集1,描述数据结构算法。
上传时间: 2015-03-21
上传用户:caiiicc
C数据结构常用算法程序集2,描述数据结构算法。
上传时间: 2014-08-23
上传用户:libenshu01
C数据结构常用算法程序集5,描述数据结构算法。
上传时间: 2013-12-04
上传用户:bibirnovis
c45决策树改进算法,主要用于数据挖掘中的聚类分析。对从事dm研究的人应该有用
上传时间: 2015-04-09
上传用户:许小华