📄 392.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [转载] 几个源码公开的有关Search Engine的东西(转寄)
发信站: 南京大学小百合站 (Tue Dec 17 18:27:34 2002)
【 以下文字转载自 GzLi 的信箱 】
【 原文由 <GzLi@smth.edu.cn> 所发表 】
来 源: 211.68.16.32
发信人: totalrecall (寂寞低手-喘口气先), 信区: AI
标 题: 几个源码公开的有关Search Engine的东西
发信站: BBS 水木清华站 (Tue Dec 17 08:06:36 2002), 转信
几个源码公开的有关Search Engine的东西,排名不分先后,
高手笑笑也无所谓。
JoBo
http://www.matuschek.net/software/jobo/index.html
Acme
http://www.acme.com/java/software/Acme.Spider.html
一个C++的Sipder,很老了
http://www.ourcode.net/ourcode/vc/vckbase/english/code/internet/Spider.shtml.
htm
一个过滤器
http://muffin.doit.org/
The New Zealand Digital Library Project
http://www.nzdl.org/cgi-bin/library
IPR Computing Ltd.
http://www.iprcom.com/index.html
一个links表,好些东东不能连了
http://www.searchtools.com/robots/robot-code.html
WebSPHINX: A Personal, Customizable Web Crawler
http://www-2.cs.cmu.edu/~rcm/websphinx/
http://www-2.cs.cmu.edu/afs/cs/user/rcm/www/papers/www7/www7.html
WebLech URL Spider
http://sourceforge.net/projects/weblech/
WebWader
http://jeanpaul.lefevre.free.fr/java/webwader/index.html
JTidy
http://sourceforge.net/projects/jtidy
Monitor Central
http://sourceforge.net/projects/monitorcentral/
--
※ 来源:·BBS 水木清华站 smth.edu.cn·[FROM: 128.196.219.149]
--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn [FROM: 211.68.16.32]
--
※ 转载:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 211.80.38.17]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -