📄 827.txt
字号:
发信人: 8088 (8088), 信区: DataMining
标 题: 2.1 技术上的定义及含义
发信站: 南京大学小百合站 (Wed Dec 12 16:23:58 2001)
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用
数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。这个定义包括好几层含义
:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要
可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。
----何为知识?从广义上理解,数据、信息也是知识的表现形式,但是人们更把概念、规则
、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉,好像从矿石中采矿
或淘金一样。原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,
如文本、图形和图像数据;甚至是分布在网络上的异构型数据。发现知识的方法可以是数
学的,也可以是非数学的;可以是演绎的,也可以是归纳的。发现的知识可以被用于信息
管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。因此,数据挖掘
是一门交叉学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识
,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人
工智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数
据挖掘这一新兴的研究领域,形成新的技术热点。
这里所说的知识发现,不是要求发现放之四海而皆准的真理,也不是要去发现崭新的自然
科学定理和纯数学公式,更不是什么机器定理证明。实际上,所有发现的知识都是相对的
,是有特定前提和约束条件,面向特定领域的,同时还要能够易于被用户理解。最好能用
自然语言表达所发现的结果。
--
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.119.36.151]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -