⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 5.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: yaomc (白头翁&山东大汉), 信区: DataMining
标  题: [合集]欢迎大家试用Luka搜索引擎
发信站: 南京大学小百合站 (Sun Dec  9 21:11:39 2001), 站内信件

boo (boo) 于Thu Nov  1 22:16:10 2001提到:

http://ecom.sjtu.edu.cn:8888/luka.html

介绍:
●Luka目前仅搜索CERNET和科技网的页面
●使用了PageRank技术和CALA算法(一个页面评价算法)
●目前暂无全文检索功能,只索引了Title和anchor text
●目前不提供布尔操作
●目前没有提供分词功能
●目前索引的页面约20多万。
●由于使用了Ranking算法,即使Crawler没有访问过的URL也可能出现
  在搜索结果中。

试用提示:
●尽可能使用教育网内可能出现的词汇,搜索中文效果更好。
●每次检索需耗时6-7秒,因为需要动态计算每个URL的相关性。
●目前使用了SQL Server做数据库,Win2k Server + IIS 5, PIII550+512MB
●该机器是本人平时工作学习之用,请不要提交大量搜索服务。

欢迎大家批评指正。


yaomc (白头翁&山东大汉) 于Fri Nov  2 08:15:50 2001提到:

速度还是比较快的,就是内容缺少了些,祝愿在以后会发展的越来越好。


roamingo (漫步鸥) 于Fri Nov  2 20:19:32 2001提到:

能达到Google的技术水平就好了. 国内现在还是没有太象样的全文搜索工具.
以前的天网, 扬帆, 后来的百度, 及新版的天网, 都不尽人意. 



boo (boo) 于Fri Nov  2 20:58:33 2001提到:

是这样的,扬帆就不说了,我们实验室几年前的作品。说是作品都有点
夸张,实际是在Verity'97上做的二次开发。

天网的搜索结果也不太理想,无关链接太多了。它的FTP搜索可能更
有名。

百度的技术细节我不清楚,只知道用了页面链接分析的技术。

现在这个Luka系统因为没有全文索引,所以感觉找到的内容太少,但
它是一个很好的网站搜索引擎(相对于页面),比如现在你输入
“交大”,“北大”,甚至“fudan”,“sjtu”试试,它的结果甚至比
Google还要好:-)(本人自吹了:-)

希望这个项目能继续下去,完成全文索引和分词,如果可以实现的话,
这至少是教育网内最好的搜索引擎了。


⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -