⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 更新说明.txt

📁 1、火车采集器V3.2版要求:您的电脑必须安装.net framework2.0框架 附windows .net framework 2.0下载地址:http://download.microso
💻 TXT
字号:
SP4更新[2008-01-18]

1、在任务中加入了[任务参数1]及[任务参数2]标签,可在任务右键菜单中修改,可直接用在WEB发布和数据库发布模块中
2、修改在线发布时的固定编码格式为任意编码可选的设置
3、增加了采网址、采内容、发内容分步操作的进度条显示
4、增加了一种新的标签格式:自增随机数字 可以生成以某数字开头的每次递增一随机数的数字,比如生成递增的时间戳
5、更新了下载文件类,进一步解决了对来源页检测和登录验证检测的文件下载的支持,增加了当前下载文件的查看功能
6、扩充了全局大小写的范围,采集分页需要大小写支持实例 http://www.lwcool.com/lw/newsfile/2007/2/10/2007210_lwcool_10350.html
7、使用全新的SOCKET类 解决了服务器提交了协议冲突. Section=ResponseHeader Detail=CR 后面必须是 LF的问题,测试地址:http://biotech.org.cn/news/news/show.php?id=56773
8、修改数据库发布设置时没有将测试的标签加载到测试窗口里
9、加入了自动检测升级版本的功能并能得到自动更新软件列表, 自动下载最新文件的功能
10、加入了自动报告BUG及建议的功能
11、在标签规则的排除和替换中加入可上下移动记录的功能
12、修正了在发布时来源页地址中未解析标签内容的问题
13、在所属采集页中加入了除默认页外的(采集页地址)这个页面,实现了可以对地址中变量的提取
14、修改了导入网址时大文件界面反应迟钝的问题
15、修改了自动插入(*)等字符时自动替换掉已选中的字符串的功能
16、替换了自动摘要中多余的空格和换行
17、导入导出任务去掉了多次确认框
18、增加了当有任务正在运行时突然关闭程序的跳出确认框
19、加入了对整个站点采网址,采内容,发内容状态的编辑
20、改变了配置文件的编码,增进了对繁体版系统的支持
21、增加了采网址时重复次数达到多少后是否继续判断还是跳过网址采集的设置
22、取消了文件是否在html项的设置,改为自动判断下载单条还是多条
23、修正了下载图片的同时可以下载文件的功能
24、全局关键词替换加入了对标题标签的替换-sp3仅支持内容标签
25、修正了保存为csv文件多内容换行时格式出错和缩略图下一行保存的问题
26、修正了Unix等系统的服务器区分URL大小写造成无法采集地址小写后页面的问题 参考:http://www.sfda.gov.cn/WS01/CL0051/index.html
27、全面启用log4net,日志异常记录更为全面
28、加入了是否补全缩略图网址的设置,可以根据自定义规则利用缩略图标签来采集列表页的内容
29、加入了是否在任务运行停止后自动注销任务显示界面的设置,利于回收资源
30、获取拼音加入了只获取首字母的设置
31、可以对中文URL地址编码进行设置,支持更广的非ASCII码URL格式支持,如你好,“地址”.html
32、内容替换里加入支持参数替换的功能,实现对内容格式的随意组合(该功能只集成在标准版)


SP3更新[2007-11-01]

增加了对数据库发布设置的保存,针对任务可以和Web发布设置一样选择不同的数据库发布设置
增加了全局敏感词过滤和近义词替换功能  [该功能集成在标准版内]
增加了对非默认端口导出到Mysql和mssql的支持
增加了对单任务设置采集、发布线程数,间隔时间,及发布到哪定义为成功的设置
增加了强力时间格式转化功能,WEB发布模块增加[时间转换]标签和[系统时间戳]标签,可以将采集过的时间重新编排为任意格式或时间戳格式
增加了设置单标签是否循环匹配的功能
增加了压缩任务ACCESS数据库的功能
增加了迅雷&FlashGet加密解密工具
增加了软件对迅雷&FlashGet地址的解密并自动下载文件的功能  [该功能集成在个人,标准版内]
增加了系统对Form表单,li,ul,frame,hr,h1-7等html标签的排除,修正了无法排除Script标签的功能
增加了对每个标签可设置是否循环匹配的功能,结合添加为新记录可针对任何标签添加出多条记录
增加了对取出的内容中第一张图为缩略图并下载的功能
增加了起始地址向导添加内使用正则提取网址的功能
增加了任务列表向任务运行显示区拖曳后开始采集的小功能


更新了自动更新的设置方式,SP3中可设置按每天,每个星期中的那天,单次运行,在某个时间段内间隔多少分钟运行一次 [该功能集成在个人,标准版内]
更新了手动分页的设置方式,可设置任意多参数和使用参数组合出分页网址
修正了在包含#符号的非锚点网址采集地址出错的问题
修正了在包含../../等上一级超过域名最顶级后地址出错的问题
修正了WEB在线发布模块编辑器内多次加载出现随机值列表框内值混乱的问题
修正了在下载文件时无法使用代理服务器的问题
修正了对部分网站采集无法得到源代码的情况
修正了下载缩略图时内容内缩略图地址无法对应的问题
修正了保存为TXT文件时没有保存缩略图的问题
修正了没有可采集网址和可发布的内容任务无法自动停止的问题
修正了带中文的网址在测试时可以采集但正式采集时无法采集到下级网址的问题
修正了中文网址采集时导入本地任务数据库[程序目录/data/任务名/SpiderResult.mdb]错误的问题
修正了导入文本网址时文本为空时预览报错的问题
更新了编辑任务时ESC退出的不合理设计,更改显示隐藏热键为Ctrl+F8


SP2更新[2007-09-26]

增加了调用迅雷或FlashGet等成熟下载组件下载文件的功能
增加了自动关机功能
增加内置浏览器自动抓取POST数据包的功能
增加了Shift+S软件显示/隐藏热键
增加了屏蔽默认缩略图功能
增加了[随机抽取值]标签,比如从自定义的作家中随机抽取一个作者
增加了设置内容中第一张图片为缩略图的功能
增加了发布内容间隔时间(以前采集和发布间隔时间一样)
增加了添加采集起始地址的预览功能
增加了开始采集地址内确认地址可删除的功能
增加了每次最大发布条数的功能,适合多次更新少量内容

修正了SP1中删除地址库和任务数据库失效的问题
修正了标签编辑框添加或编辑标签后的自动排列功能
修正了以前长期出现的采集过程中或打开全局配置出现未将对象引用设置到对象实例的错误
修正了排除<script>标签但保留了中间内容的bug
修正了批量添加时选中补零条件,时间隔倍数不起作用的一个bug
修正了使用Urlencode时没有对[采集页地址]标签encode的bug
修正了多次采集列表时会重复下载缩略图的问题
修正了自定义标签内系统时间的问题
修正了SP1中站点导出后不能导入的问题
修正了自动拼音中英文单词间无间隔符号的问题
完善了内置浏览器,增加多页浏览和自动抓取数据包功能
修正了原来系统时间12小时制为24小时制
完善了下载论坛附件功能,加入了对ftp地址的识别
完善了复制任务或标签后再粘帖生成多个副本保持名称不一样
修正了入库时对{和}正反大括号的排除问题
修正了SP1中PHPCMS,Supsite对用户客户端有要求的程序无法登录发布成功的问题


SP1更新[2007-09-16]
09-15
优化了汉英翻译时的内存和可能出现两线程访问同一个cache文件的问题,使程序更加稳定
又纠正了自动更新中选择为分钟出现持续自动更新的一个问题
增加了编辑本地数据库执行SQL的功能,使得发布含有特定关键字的文章成为可能
修正了本地数据编辑器中标记内容项为已发或未发不成功的问题
修正深度为2时测试可以采集到网址,但正式采集为0个的问题 
修正了设置程序发布到数据库定义为发布成功未生效的问题
已修正在采用非默认编码发布内容到网站时同时选择Urlencode会出现不是空格没有就是中文字符串乱码的问题
修正循环采集并添加为新记录时正式采集出现Unhandled Exception问题
修正了一个链接到空链接的相对地址补全的问题
改善了对[随机用户名]标签的支持
修正了自定义分页网址网址最大长度为255的限制
修改了模块编辑器,使刷新列表和获取随机值处支持任意标签
修正了自定义网址中的[文章编号]可以匹配任意字符的问题

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -