IBM实验室提供的数据集生成器源码,可以数据挖掘中经常使用的关联规则数据集。
上传时间: 2013-12-22
上传用户:sk5201314
一个异常点是相当不同的或不符合一个数据集的其余部分数据。检测离群点是非常重要的许多应用中,并在最近引起了广泛关注 在数据挖掘研究界。在本文中,提出了一种方法检测发现异常数据的频繁模式(或频繁项目集
上传时间: 2017-08-29
上传用户:jing911003
K-Means算法是最古老也是应用最广泛的聚类算法,它使用质心定义原型,质心是一组点的均值,通常该算法用于n维连续空间中的对象。 K-Means算法流程 step1:选择K个点作为初始质心 step2:repeat 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 until 质心不在变化 例如下图的样本集,初始选择是三个质心比较集中,但是迭代3次之后,质心趋于稳定,并将样本集分为3部分 我们对每一个步骤都进行分析 step1:选择K个点作为初始质心 这一步首先要知道K的值,也就是说K是手动设置的,而不是像EM算法那样自动聚类成n个簇 其次,如何选择初始质心 最简单的方式无异于,随机选取质心了,然后多次运行,取效果最好的那个结果。这个方法,简单但不见得有效,有很大的可能是得到局部最优。 另一种复杂的方式是,随机选取一个质心,然后计算离这个质心最远的样本点,对于每个后继质心都选取已经选取过的质心的最远点。使用这种方式,可以确保质心是随机的,并且是散开的。 step2:repeat 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 until 质心不在变化 如何定义最近的概念,对于欧式空间中的点,可以使用欧式空间,对于文档可以用余弦相似性等等。对于给定的数据,可能适应与多种合适的邻近性度量。
上传时间: 2018-11-27
上传用户:1159474180
python数据分析入门学习书记,数据分析基础性资料
上传时间: 2021-12-04
上传用户:
·人工智能及其应用(蔡自兴).pdf人工智能基础.pdf人工智能基础(高教).pdf人工智能的原理与方法.pdf人工智能导论.pdf人工智能:复杂问题求解的结构和策略.pdf人工智能.pdf人工智能(日).pdf人工智能(尼尔逊).pdf人工免疫系统原理与应用.pdf机器学习与数据挖掘方法和应用(经典).pdf高级人工智能.pdf定性推理方法.pdf次协调逻辑与人工智能.pdf
标签: 人工智能
上传时间: 2013-04-24
上传用户:xmsmh
介绍了一种基于ARM、ZigBee技术的机场智能化防鸟撞驱鸟系统。该系统采用无线监测网络结合上位机监控管理中心框架,采用低功耗控制芯片STM32F103RBT、Maxstream公司的XBee模块、短波数传电台TDX-868A,融合无线传感器网络、GPS技术、电子罗盘和ARM等工控领域的技术,采用星型网络的拓扑结构,实现了对机场区域的鸟情监测,利用数据挖掘技术,对鸟情信息进行数据分析,预报鸟情,从根本上防止鸟撞事故的发生。
上传时间: 2013-11-24
上传用户:一天睡三次
ROSETTA C++库是一个C++类库和例程集合,支持基于可识别性的经验建模和数据挖掘。它由许多用于通用机器学习和粗糙集理论的例程组成。
标签: ROSETTA
上传时间: 2015-01-11
上传用户:GavinNeko
此代码是用c语言编写的决策树的c4.5代码,它是数据挖掘分类算法中的一种,可以对给定数据集进行分类,挖掘出规则
上传时间: 2013-12-15
上传用户:sz_hjbf
关联模式的Apriori的vc实现,对数据挖掘感兴趣的人一定很希望得到吧!
上传时间: 2014-02-08
上传用户:hasan2015
GAUSS分布导引,PDF格式 对学习数据挖掘、机器学习、人工神经网络很有帮助
上传时间: 2014-01-24
上传用户:royzhangsz