📄 18.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [合集]有没有人做ftp的数据挖掘?
发信站: 南京大学小百合站 (Tue Feb 18 18:11:21 2003)
helloboy (hello) 于Tue Jan 14 09:32:23 2003)
提到:
有无搞头?
adson (自强乃报国之本) 于Tue Jan 14 12:05:50 2003)
提到:
挖什么?
Usage?Content?Structure?
我觉得对FTP的数据挖掘首先没有什么理论价值,
你很难在它上面提出一些有意义的新算法。
二来也没有实用价值,毕竟FTP的使用不是很广泛,
就目前的使用现状而言也没啥值得挖的。
【 在 helloboy 的大作中提到: 】
: 有无搞头?
jueww (觉·无我) 于Tue Jan 14 12:28:53 2003)
提到:
哇哇也好啊。呵呵。起码弄到些访问量高的WWW访问数据也不容易。
我以前还挖过学校的考研成绩库、新生住宿分配表。。。
搞数据挖掘有数据就好办。^_^
【 在 adson 的大作中提到: 】
: 挖什么?
: Usage?Content?Structure?
:
: 我觉得对FTP的数据挖掘首先没有什么理论价值,
: 你很难在它上面提出一些有意义的新算法。
:
: 二来也没有实用价值,毕竟FTP的使用不是很广泛,
: 就目前的使用现状而言也没啥值得挖的。
:
: 【 在 helloboy 的大作中提到: 】
edog (过海仙人) 于Wed Jan 15 13:54:25 2003)
提到:
请问你挖考验成绩库的时候得出一些什么有意义的结论呢?
偶的毕业论文的实例分析就是这方面的,很感兴趣的问,呵呵
【 在 jueww (觉·无我) 的大作中提到: 】
: 哇哇也好啊。呵呵。起码弄到些访问量高的WWW访问数据也不容易。
: 我以前还挖过学校的考研成绩库、新生住宿分配表。。。
: 搞数据挖掘有数据就好办。^_^
:
: 【 在 adson 的大作中提到: 】
jueww (觉·无我) 于Wed Jan 15 14:08:59 2003)
提到:
一开始我就把宿舍分配表的数据预处理一下(最麻烦的事情),然后用BN来做,发现一些
搞笑的事情,然后看看原始数据,哦。。。原来这么回事,然后就结束了。呵呵。
由于当时我的BN只能处理离散数据,所以没有做考研分数方面的东西。
主要结果是发现一些宿舍分配的几条规则,这些规则仔细看看分配表也能得到,但我先DM
做一下summerization,然后根据提示有目的地看原始数据,可能提高我了解这些规则的效
率。这大概就是DM的好处吧。
最大好处就是发现现有的技术不够用,揭示现有技术的真正不足在哪儿。这是看人家文章
(除非人家的文章把这些细节写得很详细)不可能得到的。比如BN对付不了稀疏一点的数
据。
【 在 edog 的大作中提到: 】
: 请问你挖考验成绩库的时候得出一些什么有意义的结论呢?
: 偶的毕业论文的实例分析就是这方面的,很感兴趣的问,呵呵
: 【 在 jueww (觉·无我) 的大作中提到: 】
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -