⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 2.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: yaomc (白头翁&山东大汉), 信区: DataMining
标  题: [合集]a question about k-mean method
发信站: 南京大学小百合站 (Sun Dec  9 21:03:20 2001), 站内信件

waterflower (拥抱阳光) 于Tue Oct 30 00:32:34 2001提到:

Max Clustering Passes refers to the number of passes in the K-mean 
algorithm.
这里的pass是什么意思,k-mean翻译过来是不是叫K均值算法??
(这个是DBMiner中关于cluster的帮助里的一条)

还有DBMiner中设置分类的一些参数
 classification threshold:Helps justify the classification of a particular 
subset of the data (found at a singe node) when a significant portion of 
these belong to the same class。
这怎么理解啊?还有一个噪音憨直noise threshold:Helps ignore a node if it 
contains only a negligible number of examples
看都看不懂
而且经常DBMiner会狂吃内存,一来就是64M,没办法只好强行
杀掉,赶明去加个128M。

yaomc (白头翁&山东大汉) 于Tue Oct 30 10:33:14 2001)
提到:

我觉得这个threshold应该是门限的意思,或者说是阈值的意思。



waterflower (拥抱阳光) 于Tue Oct 30 16:50:57 2001提到:

主要是针对这些憨直的解释我优点无法
理解,谁能给个这方面的例子,比方说
noise threshold是针对什么情况的??
没有什么感性认识


yaomc (白头翁&山东大汉) 于Tue Oct 30 19:09:51 2001提到:

Threshold不是憨直的意思,下面是它的解释:
门槛;门口 
起点;开端 
最低限度 
〈心理〉阈限;识阈;产生效果或 造成影响的下限。

在这个地方是门限,阈值的意思。

至于解释,我觉得可能是:帮助你判别某数据的一个子集的分类,特别是该子集中的
许多样本明显得属于某一类的时候,也就是当有多少样本属于某一类的时候,该子集
就划归为该类。举例说,如果一个数据集中有10个样本,若有6个属于A类的时候,
就可以认为该数据集可以划为A类。当然,有7个的话,就更应该属于A类,有5个地
时候,该数据集就不被认为属于A类,那么这个6即为划为某类的门限值。
至于噪音的门限值,是不是可以这样理解:如果某个节点包含了太多的可以忽略的
样本的话,那么可以把该数据列为噪音的内容。10个样本里面有6个可以忽略样本的话,
该样本集可以划为噪音的内容,那么这个6个应该为噪音的门限值。


waterflower (拥抱阳光) 于Tue Oct 30 21:42:19 2001提到:

多谢,看了解释,豁然开朗。


yaomc (白头翁&山东大汉) 于Tue Oct 30 21:54:37 2001)
提到:

有错误的地方请多多包涵。



⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -