📄 10.txt
字号:
发信人: ashun (阿顺), 信区: DataMining
标 题: 数据挖掘入门(十)
发信站: 南京大学小百合站 (Mon Aug 20 10:24:05 2001)
数据挖掘过程模型
虽然我们把各个步骤按顺序排列,但要注意数据挖掘过程并不是线性的—要取得好的结果
就要不断反复重复这些步骤。比如在“分析数据”时你可能觉得在“建立数据挖掘数据库
”时作的不够好,要往里面添加一些新的数据。
这些基本数据挖掘步骤包括:
1. 定义商业问题
2. 建立数据挖掘模型
3. 分析数据
4. 准备数据
5. 建立模型
6. 评价模型
7. 实施
1. 定义商业问题。在开始知识发现之前最先的同时也是最重要的要求就是了解的
你的数据和业务问题。如果事先没有这种了解,没有任何算法,不管他有多么复杂玄妙,
能够为你提供有价值的结果,即使有也难以使人信赖他。缺少了这些背景知识,你就没办
法明确定义要解决的问题,不能为挖掘准备数据,也很难正确的解释得到的结果。要想充
分发挥数据挖掘的价值,必须要对你的目标有一个清晰明确的定义,即决定到底想干什么
。比如你说你想提高直接邮件推销的用户回应时,你想做的可能是“提高用户响应率”,
也可能是“提高一次用户回应的价值”,要解决这两个问题而建立的模型几乎是完全不同
的,你必须做出决定。有效的问题定义还应该包含一个对你的知识发现项目得到结果进行
衡量的标准。当然还应该有整个项目预算和理性的解释。
--
业精于勤荒于嬉,行成于思毁于随。 —— 韩愈
临渊羡鱼不如退而结网。 —— 班固
勿以恶小而为之,勿以善小而不为。 —— 刘备
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.119.80.20]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -