⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 74.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: GzLi (笑梨), 信区: DataMining
标  题: [合集]我的本意
发信站: 南京大学小百合站 (Tue Feb 18 18:09:50 2003)

jueww (觉·无我) 于Sun Jan 12 15:25:54 2003)
提到:

    由于昨天时间非常紧(45分钟时间意味多少时间可能每个做个seminar的人都清楚),
而且我也不知道大家对贝叶斯网络了解多少,所以我自己的本意是

1)介绍一下比较有意思的应用结果,启发一下外行对贝叶斯网络和高频集发现的兴趣,提
高一下大家对这两个东东的信心。因为这两个东东,特别是前者,还是比较有意思的,在
实际应用中效果也不错。

2)和内行的人讨论一下学习体会。

    所以介绍的比较粗略。即没有象叶博士那样深入浅出娓娓道来,也没有向陈教授那样
列出许多问题,也没有像钱博士那样讲一个领域的情况。不过好像时间还是花去很多,真
是奇怪哦。

    我将大部分精力花在贝叶斯网络上,但在应用上来说,却还是项约束高频集发现用于
确定常见证名这个应用最为成功,为了对搞关联规则的人打气,我昨天可能特意对他说得
多了点,不过竟然有人误以为我整个系统都建立在关联规则发现基础上的,真是悲哀啊。
。。

    其实,我一直认为关联规则发现在复杂问题上的应用能力是非常有限的,不过是搞数
据库的人抢搞AI的人饭碗的一样东东罢了,有多少东西真的需要这么快的计算?真的需要
这么快的计算的时候,关联规则这么简单的模型有什么用处呢?如果关联规则有用,那我
对他做些改进,同时保证差不多的计算效率,这样做容易达到吗?

    所以,我的极端点的看法是,关联规则是垃圾。而真正属于数据挖掘自己的技术的也
就是关联规则,所以数据挖掘也是。。。,^_^。

YounieWong (王牌特工) 于Sun Jan 12 16:46:09 2003)

提到:

不好意思,本人内功不够深厚,想法可能过于简单化,请多多包涵   *^_^*

【 在 jueww 的大作中提到: 】

:     由于昨天时间非常紧(45分钟时间意味多少时间可能每个做个seminar的人都清?.

: 而且我也不知道大家对贝叶斯网络了解多少,所以我自己的本意是

: 1)介绍一下比较有意思的应用结果,启发一下外行对贝叶斯网络和高频集发现的兴?.

: 高一下大家对这两个东东的信心。因为这两个东东,特别是前者,还是比较有意思的..

: 实际应用中效果也不错。

: 2)和内行的人讨论一下学习体会。

:     所以介绍的比较粗略。即没有象叶博士那样深入浅出娓娓道来,也没有向陈教授..

: 列出许多问题,也没有像钱博士那样讲一个领域的情况。不过好像时间还是花去很多..

: 是奇怪哦。

:     我将大部分精力花在贝叶斯网络上,但在应用上来说,却还是项约束高频集发现..

: 确定常见证名这个应用最为成功,为了对搞关联规则的人打气,我昨天可能特意对他..

: 多了点,不过竟然有人误以为我整个系统都建立在关联规则发现基础上的,真是悲哀..

: 。。

:     其实,我一直认为关联规则发现在复杂问题上的应用能力是非常有限的,不过是..

: 据库的人抢搞AI的人饭碗的一样东东罢了,有多少东西真的需要这么快的计算?真的..

: 这么快的计算的时候,关联规则这么简单的模型有什么用处呢?如果关联规则有用,..

: 对他做些改进,同时保证差不多的计算效率,这样做容易达到吗?

:     所以,我的极端点的看法是,关联规则是垃圾。而真正属于数据挖掘自己的技术..

: 就是关联规则,所以数据挖掘也是。。。,^_^。


※ 修改:.YounieWong 於 Jan 12 16:46:41 2003 修改本文.[FROM: 211.80.42.8] 
daniel (飞翔鸟) 于Mon Jan 13 17:29:23 2003)
提到:

  your recognition on association mining is not very correct. you should not

compare association mining against bayesian network because they were

designed from different motivations and for different scenarios.

Also, although bayesian network is quite hot, you should not put too

much anticipation on it because at least at present causal discovery

is still a big problem. Both techniques are useful, but on different

aspects. Claim which is better or which is useless is dangerous.

  The most significant contribution of data mining, in my sense, is

to drive researchers from machine learning or some other scientific

disciplines to think about some engineering problems, which may be

caused by the increase of the volume of data. 

【 在 jueww (觉·无我) 的大作中提到: 】
:     由于昨天时间非常紧(45分钟时间意味多少时间可能每个做个seminar的人都清楚..
: 而且我也不知道大家对贝叶斯网络了解多少,所以我自己的本意是
: 1)介绍一下比较有意思的应用结果,启发一下外行对贝叶斯网络和高频集发现的兴趣..
: 高一下大家对这两个东东的信心。因为这两个东东,特别是前者,还是比较有意思的,在
: 实际应用中效果也不错。
: 2)和内行的人讨论一下学习体会。
:     所以介绍的比较粗略。即没有象叶博士那样深入浅出娓娓道来,也没有向陈教授那样
: 列出许多问题,也没有像钱博士那样讲一个领域的情况。不过好像时间还是花去很多,真
: 是奇怪哦。
:     我将大部分精力花在贝叶斯网络上,但在应用上来说,却还是项约束高频集发现用于
: 确定常见证名这个应用最为成功,为了对搞关联规则的人打气,我昨天可能特意对他说得
: 多了点,不过竟然有人误以为我整个系统都建立在关联规则发现基础上的,真是悲哀啊。
: 。。
:     其实,我一直认为关联规则发现在复杂问题上的应用能力是非常有限的,不过是搞数
: 据库的人抢搞AI的人饭碗的一样东东罢了,有多少东西真的需要这么快的计算?真的需要
: 这么快的计算的时候,关联规则这么简单的模型有什么用处呢?如果关联规则有用,那我
: 对他做些改进,同时保证差不多的计算效率,这样做容易达到吗?
:     所以,我的极端点的看法是,关联规则是垃圾。而真正属于数据挖掘自己的技术的也
: 就是关联规则,所以数据挖掘也是。。。,^_^。


jueww (觉·无我) 于Tue Jan 14 09:01:26 2003)
提到:

我已经限制了我的应用范围,也即复杂数据的分析。当然谁都知道各种方法都有各自的适
用之处。但我怀疑,在写了这么多关联规则发现的论文的人中,真正觉得自己花如此多的
精力在改进这种方法上,这些精力是物有所值的人,不会太多。就像大家一窝蜂写ANN的论
文一样。

既然搞数据挖掘是面向应用的,所以在投入的搞一个东西之前,知道这玩意的应用背景、
用途是很重要的。我们不能像搞理论的那样,为了理论而理论。

而且数据挖掘给人一个印象,就是强调速度,但是过分强调速度、而不看自己的应用对象
,会导致很多精力花在空处,当然你也可以说你的工作在其它地方或许会发现用处。但这
样做总有点冒险。对于我们实验室,还有陈老师实验室的工作,速度很少被考虑。即使要
考虑也是很后面的事情。

遍软件的人,对于提高程序速度,只记得两条原则,第一控制计算复杂性,第二提高程序
中最花时间的一部分程序的性能,而不是在程序的各个角落,都努力提高速度。而且提高
速度的途径,除了硬件和算法之外,其它的都是经验和技巧。

我总怀疑提出DM概念的那帮大公司,比如IBM,是在搞阴谋,最主要目的是推销其硬件。那
天钱博士随便说了一句话,大意是现在搞DM相关的人很少搞采样,因为一采样,就没什么
东西好搞了。^_^。

还是陈老师说得最对,搞应用研究,是为了解决实际问题,而不是为了炒作新概念。在自
己投入一个方向之前,仔细想想为什么要搞,最为要紧。

虽然我说了关联规则很多坏话,不过我的本意到不是为了大家搞这方向的人,我非常高兴
高频集发现在我的领域找到了一个很不错的、成功的应用,虽然在这个应用中,在可预见
的将来,速度仍然不是关键。

我搞贝叶斯学习也发现它的许多问题症结,所以对它也so so。一句话,天下没有免费的午
餐,单纯的数据分析对于科学发现作用有限,搞数据分析的人必须对一个应用,或几个应
用比较深入,这样才能从应用中发现问题,推动分析方法的发展。


【 在 daniel 的大作中提到: 】

:   your recognition on association mining is not very correct. you should n..
: compare association mining against bayesian network because they were

: designed from different motivations and for different scenarios.

: Also, although bayesian network is quite hot, you should not put too

: much anticipation on it because at least at present causal discovery

: is still a big problem. Both techniques are useful, but on different

: aspects. Claim which is better or which is useless is dangerous.

:   The most significant contribution of data mining, in my sense, is

: to drive researchers from machine learning or some other scientific

: disciplines to think about some engineering problems, which may be

: caused by the increase of the volume of data. 

: 【 在 jueww (觉·无我) 的大作中提到: 】

: (以下引言省略...)



NAOMIELIE (雁来红) 于Wed Jan 15 00:47:32 2003)
提到:

The sentence about the sampling is joking, maybe.

In fact, it is related to philosophy.

Consider the problem that u don't know the distribution of data,

any sampling methods may fail for any specific purpose mining tasks.

And the volumne of sampling is still a problem.


As I know, many applications of data mining cares much about the speed of 

algorithms.

Remember that the most important customs of companies like ibm is financial

enterprises, but not factories.


Productory data mining is still not the main stream of data mining or kdd.


Furthermore, ibm is not the largest data mining product provider now.

It even doesn't sell standalone intelligent miner anymore now.

The most important venders in this area is spss, sas, 

(sgi has quit, isn't it?)

And remember that ms is preparing to enter this domain for a long long time.


What they care about is not the specific applications,

but the domains that may use data mining techniques.


From research perspective, sigkdd officers are mostly db people.

(I think there is only one people is ai background).

So is for icdm, pakdd etc.


So, don't say that what others doing is meaningless.

(Although it may be meaningless to you. :))


【 在 jueww 的大作中提到: 】

: 我已经限制了我的应用范围,也即复杂数据的分析。当然谁都知道各种方法都有各自..
: 用之处。但我怀疑,在写了这么多关联规则发现的论文的人中,真正觉得自己花如此..
: 精力在改进这种方法上,这些精力是物有所值的人,不会太多。就像大家一窝蜂写AN..
: 文一样。

: 既然搞数据挖掘是面向应用的,所以在投入的搞一个东西之前,知道这玩意的应用背..
: 用途是很重要的。我们不能像搞理论的那样,为了理论而理论。

: 而且数据挖掘给人一个印象,就是强调速度,但是过分强调速度、而不看自己的应用..
: ,会导致很多精力花在空处,当然你也可以说你的工作在其它地方或许会发现用处。..
: 样做总有点冒险。对于我们实验室,还有陈老师实验室的工作,速度很少被考虑。即..
: 考虑也是很后面的事情。

: 遍软件的人,对于提高程序速度,只记得两条原则,第一控制计算复杂性,第二提高..
: 中最花时间的一部分程序的性能,而不是在程序的各个角落,都努力提高速度。而且..
: 速度的途径,除了硬件和算法之外,其它的都是经验和技巧。

: 我总怀疑提出DM概念的那帮大公司,比如IBM,是在搞阴谋,最主要目的是推销其硬

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -