⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 2.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: ashun (阿顺), 信区: DataMining
标  题: 数据挖掘入门(二)
发信站: 南京大学小百合站 (Mon Aug 20 10:04:42 2001)

数据挖掘:不能干什么


数据挖掘是一个工具,而不是有魔力的权杖。它不会坐在你的数据库上一直监视着数据库
,然后当他发现有意义的模型时给你发一封电子邮件。他仍然需要了解你的业务,理解你
的数据,弄清分析方法。数据挖掘只是帮助商业人士更深入、更容易的分析数据 --- 他无
法告诉你某个模型对你的企业的实际价值。而且数据挖掘中得到的模型必须要在现实生活
中进行验证。


注意数据挖掘中得到的预言模型并不会告诉你一个人为什么会做一件事、采取某个行动,
他只会告诉你他会这样做,为什么要人去考虑。比如,数据挖掘可能会告诉你,如果这个
人是男的、年收入在5万到6万之间,那么他可能会买你的商品/服务。你可能会利用这条规
则,集中向这类人推销你的商品而从中获益,但是数据挖掘工具不会告诉你他们为什么会
买你的东西,也不能保证所有符合这条规则的人都会买。


为了保证数据挖掘结果的价值,你自己必须了解你的数据,这一点至关重要。输入数据库
中的异常数据、不相关的字段或互相冲突的字段(比如年龄和生日不一致)、数据的编码
方式等都会对数据挖掘输出结果的质量产生影响。虽然一些算法自身会对上面提到的这些
问题做一些考虑,但让算法自己做所有这些决定是不明智的。


数据挖掘不会在缺乏指导的情况下自动的发现模型。你不能这样对数据挖掘工具说,“帮
我提高直接邮件推销的响应率”,你应该让数据挖掘工具找(1)对你的推销回应的人,或(
2)即回应又做了大量订单的人的特征。在数据挖掘中寻找这两种模型是很不相同的。


虽然数据挖掘工具使你不必再掌握艰深的统计分析技术,但你仍然需要知道你所选用的数
据挖掘工具是如何工作的,他所采用的算法的原理是什么。你所选用的技术和优化方法会
对你的模型的准确度和生成速度产生很大影响。


数据挖掘永远不会替代有经验的商业分析师或管理人员所起的作用,他只是提供一个强大
的工具。每个成熟的、了解市场的公司都已经具有一些重要的、能产生高回报的模型,这
些模型可能是管理人员花了很长时间,作了很多调查,甚至是经过很多失误之后得来的。
数据挖掘工具要做的就是使这些模型得到的更容易,更方便,而且有根据。
--
业精于勤荒于嬉,行成于思毁于随。 —— 韩愈
临渊羡鱼不如退而结网。           —— 班固
勿以恶小而为之,勿以善小而不为。 —— 刘备

※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.119.80.20]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -