⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 436.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: easehawking (以鹰行猎), 信区: DataMining
标  题: Re: 菜鸟关于DM的看法
发信站: 南京大学小百合站 (Wed Jul 24 19:46:50 2002)

问题就是研究的动力。所问的正好的与我所作工作的相关,让我感到欣慰。因为我的数学
烂,搞算法不在行,只好去做些实际的东东。


首先,我的研究是以知识体本身为主发点,这其中借用了面向对象的思想。因为挖掘到的
知识才是客户最关心的。而各种算法(包括预处理算法)被推到次要的地位。挖掘出了知
识,就必须在实践领域中使用它。特别象神经网络这类的,根本没法看;而决策树等直观
的知识最后目的还是使用。同样,真正的评价也必须是在实践中去检验,支持度置信度来
源于训练集,没有太大的实际意义。


现在己存在多种知识表示方式,但没有一种是万能了。我的做法是对现状妥协,为每类知
识表示方式开发各种组件原型。组件原型装入知识数据,就行为一个知识实例,可以直接
使用。


组件可以用通用的技术开发,如COM、CORBA和JAVA BEAN等,从而挖掘系统挖出的知识可以
被其它系统调用(只需它们建立一个组件并载入知识数据)。


接着,该说DM了。知识库中的知识数据可以来自实用域的经验之类。专家系统的挫折证明
这样的不可行,所以才要DM嘛。因此,实用型的知识组件都会配有一个(或多个)知识抽
取组件,以从训练数据集中挖掘知识。象神经网络会配BP算法(或更好的算法)去训练。
出于对混合算法的考虑,我还允许高级的知识之间变换,比如规则<-->神经网络。除此之
外还吸收了基于范例推理(CBR)的思想。


其次,GzLi说了,调节生产参数可以创利。同样,不少挖掘算法自身也要调节参数,才能
达到最佳的效果。我也考虑了这种情况,并设想其调节的方式,自动或半自动地选择次最
算法参数。难度巨大。


以上只是我的一点想法。它有没有前途,首先要看它的价值,其次还要看它是否可行。因
为实现工作还没完成,可能就显得大而空,因为这样就把DM扩大成自适应自学习系统了。
但是DM提出者是把数据分析从业务系统中分离出来,而我又想把它放回去,不知道是不是
一种退化。


即使有意义,接下来还有一大堆工作要做,涉及已有数据库、过程控制等技术及知识库、
优化等这些老大难问题。

【 在 highso 的大作中提到: 】

: 所谓DM,搞来搞去都是完美的算法,首先且不论这些算法

: 是否具有普遍适用性,就是这些算法的实现,也不是很容易

: 的事情,实现了算法,提取了所谓的知识,或者说规则,

: 怎么合理的评判这些规则,怎么使用这些规则,都有很大的问题

: 所以DM注定了实用性上是大打折扣,可信度上也很值得怀疑

: 所以是不是这也是DM的悲哀?

: 我不是搞DM的,只是想在课题中用到DM,可是发现要去实现一个

: 算法并不是很easy,希望有人能指点一下。

: 不当之处,请大侠指正。


--
清除前进路上的一切障碍!

※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 210.53.42.132]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -