蜘蛛 - 虫虫下载站

蜘蛛

基于JAVA的网络蜘蛛系统,使用JAVA实现抓取网络资源的网络蜘蛛。通过一个入口网址来扫描整个互联网的网址

基于JAVA的网络蜘蛛系统,使用JAVA实现抓取网络资源的网络蜘蛛。通过一个入口网址来扫描整个互联网的网址，并将这些扫描到的网址所指向的网络资源下载到本地。然后可以利用其他的分析工具对这些网络资源做进一步的分析。

标签： JAVA 网络网址

上传时间： 2013-12-26

上传用户：xinyuzhiqiwuwu
不错的网络蜘蛛

不错的网络蜘蛛，有源码及其文档和大家分享一下希望对大家有帮助

标签： 网络

上传时间： 2017-08-21

上传用户：qb1993225
内有吃金豆连连看网络浏览器中国象棋端口扫描聊天蜘蛛纸牌代码

内有吃金豆连连看网络浏览器中国象棋端口扫描聊天蜘蛛纸牌代码

标签： 网络浏览器端口代码

上传时间： 2014-12-04

上传用户：nanshan
用Java编写的蜘蛛纸牌程序和源代码

用Java编写的蜘蛛纸牌程序和源代码，很好的学习资料

标签： Java 编写程序源代码

上传时间： 2014-01-19

上传用户：坏天使kk
基于Arduino 设计的“ Miles”开源四足蜘蛛机器人(电路图)

基于Arduino 设计的“ Miles”开源四足蜘蛛机器人(电路图)基于Arduino 设计的“ Miles”开源四足蜘蛛机器人(电路图)

标签： arduino

上传时间： 2021-12-11

上传用户：默默
基于JAVA技术的搜索引擎的研究与实现

本文还利用Java技术对搜索引擎的三个核心部分即网络蜘蛛、网页索引、搜索进行了实现。索引和搜索部分借助Lucene全文搜索引擎库中的Java类进行实现。实现搜索引擎的个性化，使搜索引擎具有自我学习的功能，能自动地适应用户的查询需求，并能对用户进行智能分类从而为搜索引擎的个性化提供依据。

标签： JAVA 搜索引擎

上传时间： 2014-01-11

上传用户：masochism
< 网络机器人java编程指南>>的配套源程序

< 网络机器人java编程指南>>的配套源程序，研究如何实现具有Web访问能力的网络机器人的书。从Internet编程的基本原理出发，深入浅出、循序渐进地阐述了网络机器人程序Spider、Bot、Aggregator的实现技术，并分析了每种程序的优点及适用场合。本书提供了大量的有效源代码，并对这些代码进行了详细的分析。通过本书的介绍，你可以很方便地利用这些技术，设计并实现网络蜘蛛或网络信息搜索器等机器人程序。

标签： java gt lt 网络

上传时间： 2014-01-06

上传用户：waitingfy
蚁群算法上传一个文件这么复杂啊？生命在长期进化过程中

蚁群算法上传一个文件这么复杂啊？生命在长期进化过程中，积累了很多新奇的功能，人类很早就从中得到启发而改进自己的工具，如史书中记戴“见蓬转而做车辑”，传说鲁班被茅苇划破，而发明锯子……也许早先的发明,只是偶然的模仿和发现,后来人们已有意识地进行这方面的研究,这就是“仿生学”。仿生学顾名思义就是模仿生物的某些功能的学问。有名的例子很多，如模仿海豚皮而构造的“海豚皮游泳衣”、科学家研究鲸鱼的皮肤时，发现其上有沟漕的结构，于是有个科学家就依照鲸鱼皮构造，造成一个薄膜蒙在飞机的表面，据实验可节约能源3%，若全国的飞机都蒙上这样的表面，每年可节约几十亿。又如有科学家研究蜘蛛，发现蜘蛛的腿上没有肌肉，有脚的动物会走，主要是靠肌肉的收缩，现在蜘蛛没有肌肉为什么会走路？经研究蜘蛛不是靠肌肉的收缩进行走路的，而是靠其中的“液压”的结构进行走路，据此人们发明了液压步行机……总之,从自然界得到启迪, 模仿其结构进行发明创造.这就是仿生学. 这是我们向自然界学习的一个方面.另一方面,我们还可以从自然的规律中得到启迪,利用其原理进行设计(包括设计算法),这就是智能计算的思想.

标签： 蚁群算法过程

上传时间： 2014-01-21

上传用户：kernaling
一个Web爬虫（机器人

一个Web爬虫（机器人，蜘蛛）Java类库，最初由Carnegie Mellon 大学的Robert Miller开发。支持多线程，HTML解析，URL过滤，页面配置，模式匹配，镜像，等等。

标签： Web 机器人

上传时间： 2013-12-26

上传用户：refent
1、锁定某个主题抓取； 2、能够产生日志文本文件

1、锁定某个主题抓取； 2、能够产生日志文本文件，格式为：时间戳(timestamp)、URL； 3、抓取某一URL时最多允许建立2个连接（注意：本地作网页解析的线程数则不限） 4、遵守文明蜘蛛规则：必须分析robots.txt文件和meta tag有无限制；一个线程抓完一个网页后要sleep 2秒钟； 5、能对HTML网页进行解析，提取出链接URL，能判别提取的URL是否已处理过，不重复解析已crawl过的网页； 6、能够对spider/crawler程序的一些基本参数进行设置，包括：抓取深度(depth)、种子URL等； 7、使用User-agent向服务器表明自己的身份； 8、产生抓取统计信息：包括抓取速度、抓取完成所需时间、抓取网页总数；重要变量和所有类、方法加注释； 9、请遵守编程规范，如类、方法、文件等的命名规范， 10、可选：GUI图形用户界面、web界面，通过界面管理spider/crawler，包括启停、URL增删等

标签： 日志

上传时间： 2013-12-22

上传用户：wang5829