📄 887.txt
字号:
发信人: chdq135 (阿权), 信区: DataMining
标 题: Re: 有没有人对web mining和$联接分析有兴趣?
发信站: 南京大学小百合站 (Tue May 28 08:55:48 2002), 站内信件
其实也不竟然。PageRank的超链分析是与用户的查询无关的。它是将所有的
超链每隔一段时间就更新一次,需要一天左右。
而HITS是与用户查询相关的,既是,它所有的链接都是从文字内容上可能
相关的链接,然后计算超链。实时的
其实用户的使用情况数据,可以从两个方面获取,一个是服务器端的日志,一个是用户
端的
cookie或其他什么程序之类。自己搜集不大可能,除非自己有网站,要与网站的网管练
习
中国人穷,就寄希望于技术了。但是中国的人力也很便宜,说不准中国1000个人的工资
也敢不上
Yahoo的10个人的工资了。
呵呵,该死的网络
【 在 explorer (时刻准备着) 的大作中提到: 】
: google是连接和文本结合的,纯粹的连接是不行。
: google关键技术有pagerank,indexer,sorter,同义词汇表,crawler等。
: 在这方面都没法和他比,google最近又提供专家回答问题,是活生生的专家回答你。
: yahoo雇了100多个职业编辑做网页分类,国内步他们后成都不可能。
: 感觉在用户接口界面方面还可以做点工作,很多搜索引擎的界面很简单,有提高的
: 空间。
: 【 在 chdq135 (阿权) 的大作中提到: 】
: : 中国历来是跟着别人走,叫“攻关”麻
: : 但是,总不能消化它。还是南京大学的张福炎好,不追求最新
: : 但求能够做点是在事情!
: : 尽管不新,但是可以做很多事情,国外也还在做这方面的事情和项目。
: : 单独的超链分析是不行的,但是可以揭示很多问题。如果结合文本分析和
: : 用户使用情况分析,提出“web挖掘引擎”还是可行的
: ~~~~~~~~~数据哪里来,自己搜集或是买。
: 信息检索越来越多的需要人工的干预,这个成本太大了,没有财力雇很多人的。
: 不知道数据挖掘怎么样。
: 欢迎继续探讨,explorer@mes.nju.edu.cn
--
知我者谓我心忧 ☆★ ★☆ 不知我者谓我何求?
忧忧苍天 ★ 此何人哉![0m
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 159.226.100.197]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -