⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 1.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: GzLi (笑梨), 信区: DataMining
标  题: [转载] 数据开采工具及应用(一)
发信站: 南京大学小百合站 (Fri Nov  1 22:32:33 2002), 站内信件

【 以下文字转载自 AI 讨论区 】
【 原文由 yinsoft 所发表 】

数据开采工具的任务
    数据开采工具的目标是从数据库中发现隐含的、有意义的知识,
主要有以下4类任务: 
    1.关联分析
    数据关联是数据库中存在的一类重要的可被发现的知识。若两个
或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简
单关联(例如,购买面包的顾客中有90%的人同时购买牛奶)、时序关联
(例如,若AT&T股票连续上涨两天且DEC股票不下跌,则第三天IBM股票
上涨的可能性为75%)、因果关联。关联分析的目的是找出数据库中隐
藏的关联网。有时并不知道数据库中数据的关联是否存在精确的关联
函数,即使知道也是不确定的,因此关联分析生成的规则带有可信度。

    2.聚类
    数据库中的记录可被划分为一系列有意义的子集,即聚类。聚类
增强了人们对客观现实的认识,是概念描述和偏差分析的先决条件。
聚类技术主要包括传统的模式识别方法和数学分类学。80年代初,Mic
halski提出了概念聚类技术。其要点是,在划分对象时不仅考虑对象
之间的距离,还要求划分得出的类具有某种内涵描述,从而避免了传统
技术的某些片面性。
    3.概念描述
    概念描述就是对某类对象的内涵进行描述,并概括这类对象的有
关特征。概念描述分为特征性描述和区别性描述,前者描述某类对象
的共同特征,后者描述不同类对象之间的区别。生成一个类的特征性
描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多
, 如决策树方法、遗传算法等。

    4.偏差检测
    数据库中的数据常有一些异常记录,从数据库中检测这些偏差很
有意义。偏差包括很多潜在的知识,如分类中的反常实例、不满足规
则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。偏
差检测的基本方法是,寻找观测结果与参照值之间有意义的差别。



--
欢迎进入—--军事主页
http://202.119.36.47/~sunlight

※ 来源:.南京大学小百合站 dii.nju.edu.cn.[FROM: aiake1.nju.edu.c]
--
※ 转载:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 211.80.38.17]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -