⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 ml.htm

📁 K-means聚类算法的研究
💻 HTM
字号:

<!ArtChnTitle>
<!ArtChnAuthor>
<!ArtAuthorAddress>
<!ArtChnAbstract>
<!ArtChnKeyword>
<!ArtEngTitle>
<!ArtEngAuthor>
<!ArtEngAbstract>
<!ArtEngKeyword>
<html>

<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta name="GENERATOR" content="Microsoft FrontPage 5.0">
<title>学位论文-K-means聚类算法的研究</title>
<style>A:link {COLOR: #000000; FONT-FAMILY: 宋体; TEXT-DECORATION: none}
A:visited {COLOR: #000000; FONT-FAMILY: 宋体; TEXT-DECORATION: none}
A:active {FONT-FAMILY:宋体; TEXT-DECORATION: none}
A:hover {COLOR: #000000;TEXT-DECORATION:none}
BODY {FONT-FAMILY:宋体; FONT-SIZE: 9pt;TEXT-DECORATION:none}
TABLE {FONT-FAMILY: 宋体; FONT-SIZE: 9pt}
.H1 {FONT-SIZE: 9pt; COLOR: #0000cc}
.ourfont {FONT-SIZE: 9pt; LINE-HEIGHT: 14pt}
select {font-size:12px;}
.wx {BACKGROUND: #001863; BORDER-BOTTOM: white 1px solid; BORDER-LEFT: white 1px solid; BORDER-RIGHT: white 1px solid; BORDER-TOP: white 1px solid; COLOR: #ffffff; FONT-SIZE: 9pt; FONT-STYLE: normal; FONT-VARIANT: normal; FONT-WEIGHT: normal; HEIGHT: 18px; LINE-HEIGHT: normal}
.wx1 {border-top: #c0c0c0 1px;border-left: #c0c0c0 1px;border-right:#c0c0c0 1px;border-bottom:#c0c0c0 1px;border-style:inset;background-color:#ffffff;vertical-align:text-bottom}
</style>
</head>

<body bgcolor="#FFFFFF" link="#000000" background="../image/bg.gif">
<img src="../../images/xwlwk.jpg" width="750" height="94">
<table width="83%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="19%"><p>&nbsp;</p>
<p></p></td>
<td width="81%"><p>馆藏号:Y1226557<br>
<br>
论 文 题 目:<strong style="font-weight: 400">K-means聚类算法的研究</strong><br>
学位授予单位:大连理工大学<br>
作    者:冯超<br>
申请学位级别:硕士<br>
学 科 名 称:软件工程<br>
指 导 教 师:吴国伟<br>
出 版 时 间:20071215<br>
摘    要:<br>
&nbsp;&nbsp;&nbsp; 聚类是数据挖掘领域中重要的技术之一,用于发现数据中未知的分类。聚类分析已经有了很长的研究历史,其重要性已经越来越受到人们的肯定。聚类算法是机器学习、数据挖掘和模式识别等研究方向的重要研究内容之一,在识别数据对象的内在关系方面,具有极其重要的作用。聚类主要应用于模式识别中的语音识别、字符识别等,机器学习中的聚类算法应用于图像分割,图像处理中,主要用于数据压缩、信息检索。聚类的另一个主要应用是数据挖掘、时空数据库应用、序列和异常数据分析等。此外,聚类还应用于统计科学,同时,在生物学、地质学、地理学以及市场营销等方面也有着重要的作用。<br>&nbsp;&nbsp;&nbsp;&nbsp;    本文是对聚类算法K-means的研究。首先介绍了聚类技术的相关概念。其次重点对K-means算法进行了分析研究,K-means算法是一种基于划分的方法,该算法的优点是简单易行,时间复杂度为O(n),并且适用于处理大规模数据。但是该算法存在以下缺点:需要给定初始的聚类个数K以及K个聚类中心,算法对初始聚类中心点的选择很敏感,容易陷入局部最优,并且一般只能发现球状簇。本文针对聚类个数K的确定、初始K个聚类中心的选定作了改进,给出了改进的算法MMDBK(Max-Min and Davies-BouldinIndexbased K-means,简称MMDBK)。算法的出发点是确保发现聚类中心的同时使同一类内的相似度大,而不同类之间的相似度小。算法采用Davies-Bouldin Index聚类指标确定最佳聚类个数,改进的最大最小距离法选取新的聚类中心,以及聚类中心的近邻查找法来保证各个类之间的较小的相似度。文中最后使用KDD99数据集作为实验数据,对K-means算法以及MMDBK算法进行了仿真实验。结果显示改进后的MMDBK算法在入侵检测中是有效的。<br>&nbsp;&nbsp;&nbsp;&nbsp;<br>
分  类  号:TP311.13;TP301.6<br>
关  键  词:数据挖掘;聚类分析;K-means;入侵检测
<p align="center">
<table width="80" border="0" cellspacing="0" cellpadding="0">
<tr>
<td bgcolor="#cccccc">
<table width="100%" border="0" cellspacing="1" cellpadding="0">
<tr style="CURSOR: hand">
<td bgcolor="#CCCCCC" onMouseOver="this.bgColor='#999999';" onMouseOut="this.bgColor='#cccccc';" valign="bottom" height="18"  NAME="NAME_BALL" STYLE="cursor:hand" child="FALL"><div align="center"><strong><font size="4"><a href="index.htm">PDF正文</a></font></strong></div></td>
</tr>
</table></td>
</tr>
</table>
  </td>
</tr>
</table>
<div align="center"></div>
</body>
</html>

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -