📄 187.txt
字号:
发信人: fervvac (高远), 信区: DataMining
标 题: Re: 非平凡过程?
发信站: 南京大学小百合站 (Sun Dec 30 15:51:10 2001), 站内信件
My understanding for this terms is somewhat similar to yours:
trivial means sth. that can be easily known, obtained, etc.
Before DM came into play, peoples had already begun some analysis of the hist
oric data, but mostly by using some naive methods (like counting, drawing cur
ves, etc) or some basic statistical methods (finding the distribution, cross
validatation). I guess
those methods are called trivial in the DM context.
So what DM methods are trying to do is a step further. For example, for the s
tock data, previously we can only draw the curves, try to predict what's the
trend solely by the experience of the analyst, but with DM techniques, we mig
ht do it more
accurately and probably more scientifically, :-)
【 在 yaomc (白头翁&山东大汉) 的大作中提到: 】 : 平凡的东西是很容易得到的,也
比较浅显,或者说是可以比较准确的预测的。
: 获得此类的知识不需要太多的技巧和应用专门的工具,只要对于此领域比较熟悉,
: 能够熟练的预测事物的发展趋势。
: 而非平凡则是相对于平凡来说的。数据挖掘有时候强调的是,所挖掘的知识
: 往往不易通过简单的分析就能够得到,这些知识可能隐含在表面现象的内里,
: 需要经常大量数据的比较分析,应用一些专门对付大数据量的工具,才有可能得到。
: 得到的知识往往具有出乎意料的意味,因此也往往是不容易预测到的,当然,
: 数据挖掘得到的知识也用于对事物趋势的预测。
: 有时候数据挖掘的目的是发现那些出现概率比较小的现象,这些东西好像用一般
: 统计的方法往往很难获得。
: 所以,俺认为数据挖掘得到的非平凡知识就是那些往往出乎预料的东西。不是那些领导
: 们拍拍脑瓜就能够得到的。比如说那个尿布与啤酒的关系,是不是比较特别?
: 【 在 explorer (void) 的大作中提到: 】
: : 我的理解是数决挖掘过程不是线性的,不是从开始一直向下走到结束。
: : 在挖掘过程中有反复,有循环,有跳转,而且这种反复和循环和跳转是没有规律的。
: : 仅供参考。
--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 143.89.156.5]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -