⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 189.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: boo (boo), 信区: DataMining
标  题: Re: 欢迎大家试用Luka搜索引擎
发信站: 南京大学小百合站 (Fri Nov  2 20:58:33 2001), 站内信件

是这样的,扬帆就不说了,我们实验室几年前的作品。说是作品都有点
夸张,实际是在Verity'97上做的二次开发。

天网的搜索结果也不太理想,无关链接太多了。它的FTP搜索可能更
有名。

百度的技术细节我不清楚,只知道用了页面链接分析的技术。

现在这个Luka系统因为没有全文索引,所以感觉找到的内容太少,但
它是一个很好的网站搜索引擎(相对于页面),比如现在你输入
“交大”,“北大”,甚至“fudan”,“sjtu”试试,它的结果甚至比
Google还要好:-)(本人自吹了:-)

希望这个项目能继续下去,完成全文索引和分词,如果可以实现的话,
这至少是教育网内最好的搜索引擎了。
【 在 roamingo (漫步鸥) 的大作中提到: 】
: 能达到Google的技术水平就好了. 国内现在还是没有太象样的全文搜索工具.
: 以前的天网, 扬帆, 后来的百度, 及新版的天网, 都不尽人意. 
: 【 在 boo (boo) 的大作中提到: 】
: : http://ecom.sjtu.edu.cn:8888/luka.html
: : 介绍:
: : ●Luka目前仅搜索CERNET和科技网的页面
: : ●使用了PageRank技术和CALA算法(一个页面评价算法)
: : ●目前暂无全文检索功能,只索引了Title和anchor text
: : ●目前不提供布尔操作
: : ●目前没有提供分词功能
: : ●目前索引的页面约20多万。
: : ●由于使用了Ranking算法,即使Crawler没有访问过的URL也可能出现
: :   在搜索结果中。
: : 试用提示:
: : ●尽可能使用教育网内可能出现的词汇,搜索中文效果更好。
: : ●每次检索需耗时6-7秒,因为需要动态计算每个URL的相关性。
: : ●目前使用了SQL Server做数据库,Win2k Server + IIS 5, PIII550+512MB
: : ●该机器是本人平时工作学习之用,请不要提交大量搜索服务。
: : 欢迎大家批评指正。


--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 202.120.7.59]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -