📄 867.txt
字号:
发信人: 8088 (8088), 信区: DataMining
标 题: 13 实施数据挖掘项目考虑的问题
发信站: 南京大学小百合站 (Wed Dec 12 16:42:50 2001)
谈到数据挖掘应从以下三方面加以考虑,一是用数据挖掘解决什么样的商业问题,二是为
进行数据挖掘所做的数据准备,三是数据挖掘的各种分析算法。
数据挖掘的分析算法主要来自于以下两个方面:统计分析和人工智能(机器学习、模式识
别等)。数据挖掘研究人员和数据挖掘软件供应商,在这一方面所做的主要工作是优化现
有的一些算法,以适应大数据量。另外需要强调的是,任何一种数据挖掘的算法,不管是
统计分析方法、神经元网络、各种树分析方法,还是遗传算法,没有一种算法是万能的。
不同的商业问题,需要用不同的方法去解决。即使对于同一个商业问题,可能有多种算法
,这个时候,也需要评估对于这一特定问题和特定数据哪一种算法表现好。
做数据挖掘研究的人,往往把主要的精力用于改进现有算法和研究新算法上。人们都知道
数据准备是必不可少的一步,但很少有人去真正花时间和精力去研究。其实数据挖掘最后
成功与失败,是否有经济效益,数据准备起到了至关重要的作用。数据准备包含很多方面
:一是从多种数据源去综合数据挖掘所需要的数据,保证数据的综合性、易用性、数据的
质量和数据的时效性,这有可能要用到数据仓库的思想和技术;另一方面就是如何从现有
数据中衍生出所需要的指标,这主要取决于数据挖掘者的分析经验和工具的方便性。
众所周知,SQL是广泛用于数据库查询的语言,有很多数据挖掘软件提供商利用SQL来为数
据挖掘做数据准备,但就笔者多年来的分析经验和同其他专家探讨感觉到,SQL在很多时候
有些力不从心,因为数据挖掘和分析的一些算法通常要求数据具有一定的格式和规范性。
还需要强调的一点是,人们通常把数据挖掘工具看得过份神秘,认为只要有了一个数据挖
掘工具,就能自动挖掘出所需要的信息,就能更好地进行企业运作,这是认识上的一个误
区。其实要想真正做好数据挖掘,数据挖掘工具只是其中的一个方面,同时还需要对企业
业务的深入了解和数据分析经验。一个企业要想在未来的市场中具有竞争力,必须有一些
数据挖掘方面的专家,专门从事数据分析和数据挖掘工作。再同其他部门协调,把挖掘出
来的信息供管理者决策参考,最后把挖掘出的知识物化。在国内的企业中,还很少有决策
人员认识到这一点。如果管理者没有这方面的意识,数据挖掘和数据分析就很难发挥应有
的作用,很容易走向两个极端,一是认为数据挖掘没有用处,二是开始认为数据挖掘是万
能的。如此得到的结果往往与初始期望相去太远。
--
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.119.36.151]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -