383.txt

来自「This complete matlab for neural network」· 文本代码 · 共 29 行

TXT

29 行

发信人: roamingo (漫步鸥), 信区: DataMining
标  题: Re: 有没有关于XML的cluster算法???
发信站: 南京大学小百合站 (Mon Nov 19 13:08:35 2001), 站内信件

聚类基本的方法是定义两个对象的距离. 最好能满足三角形边长不等式: 
L(AB) <= L(AC)+L(BC)  
再使用经典的k-means或hierarchical方法.

这对连续低维数据是比较方便的. 对离散数据可以采用一些特殊的离散距离计算方法. 
也可采用不依赖于距离的方法: 定义一个优化目标, 再优化得到某个local mininal. 

对于具体的应用, 如XML文档的cluster, 就要具体分析了.

【 在 ssos (存在与虚无) 的大作中提到: 】
: 应当考虑文字内容吧
: 两个树型结构有结构上的不一致,还有内容上的不一致,根据这进行cluster
: 有啥好办法么??
: 【 在 roamingo (漫步鸥) 的大作中提到: 】
: : 如何按照树型结构进行Cluster呢? 比较树之间结构的相似度? 要考虑文字内容吗?
: : 有什么具体应用呢?  倒是一个比较超前的想法, 日后网络上XML越来越多, 应该有
: : 很好的发展前景.


--
Read digitally, save a tree.

※ 修改:．roamingo 於 Nov 19 13:10:47 修改本文．[FROM: 202.120.7.27]
※ 来源:．南京大学小百合站 bbs.nju.edu.cn．[FROM: 202.120.7.27]

383.txt - 源码说明

本页面展示了「This complete matlab for neural network」中的 383.txt 源码文件，采用文本编程语言编写，共 29 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与complete相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?