⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 26.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: GzLi (笑梨), 信区: DataMining
标  题: [合集]web mining 问题,盼诸位赐教!
发信站: 南京大学小百合站 (Tue Jan  7 11:10:07 2003)

pigly (糊涂) 于Mon Jan  6 10:07:44 2003)
提到:

进行web mining是需要日志文件和站点文件的(对web使用挖掘而言),而使用web minin
g的主要是web server,本版提供的日志文件是berkly的代理日志,无法使用其进行web结构
以及用户兴趣模式库的架构。

非常希望能大家能提供某一个web站点的引用日志

而且网站最好是有大量的动态网页,进行真正意义上的web mining

我的感觉,做web mining最大的工作量是在数据预处理上

以上是我的个人理解,估计有许多问题,请大家帮忙改正

小弟做研究,迫切需要一个web server的日志进行分析(如果是访问量比较大的个人网站
也可)

恳请大家帮忙,感激感激!



helloboy (hello) 于Mon Jan  6 14:59:28 2003)
提到:

As I have previously discussed, the difficulty of Web mining research
is short of experimental data. Berkly log can't be used when combining
web log , web content and web structure mining.
You can test your alogrihtm using your own server log.
But the result is not so convincing.

【 在 pigly (糊涂) 的大作中提到: 】
: 进行web mining是需要日志文件和站点文件的(对web使用挖掘而言),而使用web minin
: g的主要是web server,本版提供的日志文件是berkly的代理日志,无法使用其进行web..
: 以及用户兴趣模式库的架构。
: 非常希望能大家能提供某一个web站点的引用日志
: 而且网站最好是有大量的动态网页,进行真正意义上的web mining
: 我的感觉,做web mining最大的工作量是在数据预处理上
: 以上是我的个人理解,估计有许多问题,请大家帮忙改正
: 小弟做研究,迫切需要一个web server的日志进行分析(如果是访问量比较大的个人网站
: 也可)
: 恳请大家帮忙,感激感激!


pigly (糊涂) 于Mon Jan  6 15:18:05 2003)
提到:

正如你所说“the difficulty of Web mining research is short of experimental dat
a.”所以希望大家能提供一些web日志,帮助研究与学习!


【 在 helloboy 的大作中提到: 】

: As I have previously discussed, the difficulty of Web mining research

: is short of experimental data. Berkly log can't be used when combining

: web log , web content and web structure mining.

: You can test your alogrihtm using your own server log.

: But the result is not so convincing.

: 【 在 pigly (糊涂) 的大作中提到: 】



edog (过海仙人) 于Tue Jan  7 00:52:51 2003)
提到:

【 在 pigly (糊涂) 的大作中提到: 】
: 进行web mining是需要日志文件和站点文件的(对web使用挖掘而言),而使用web minin
: g的主要是web server,本版提供的日志文件是berkly的代理日志,无法使用其进行web..
: 以及用户兴趣模式库的架构。
: 非常希望能大家能提供某一个web站点的引用日志
: 而且网站最好是有大量的动态网页,进行真正意义上的web mining
: 我的感觉,做web mining最大的工作量是在数据预处理上
              ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~非常同意!
但是感觉目前对数据预处理研究地不是很多,主要是太繁杂,不容易出成果。         
         
: 以上是我的个人理解,估计有许多问题,请大家帮忙改正
: 小弟做研究,迫切需要一个web server的日志进行分析(如果是访问量比较大的个人网站
: 也可)
: 恳请大家帮忙,感激感激!


⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -