⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 manual.parselink

📁 此源码功能是捕获网页中的链接并进行分析
💻 PARSELINK
字号:
ParseLink for the CWT100g程序使用文档2005-04-09 by YHF所有程序代码是在linux环境下调试通过. 欢迎大家提供相应的window版本.一、名词约定以下名词在程序名和参数名中出现:Raw: 原始网页库,文件名必须以"Tianwang.raw."开头.Src: 表示将要读取的源文件,如SrcFile.Dest: 表示将要写入的目标文件,即程序将要生成的文件,如DestFile.二、程序约定程序都需要指定参数,如果不带参数运行,则显示该程序的一段简要说明.在不清楚程序运行参数的情况下,不带参数运行一下,可以了解该程序的使用方法.三、详细说明1. ParseLink: 该程序从一个Raw文件中提取出每个网页标识的urls.usage: ParseLink RawDataFile说明:提取出的links保存在文件"url."+RawDataFile中. 2. ParseLink_d: 该程序将整个目录下的Raw文件串行提取links,避免一个一个文件操作.usage:   ParseLink_d DestDbDir RawDataDir说明:该程序调用上述程序ParseLink。所以必须确保ParseLink在PATH指定的目录下,如$HOME/bin下.

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -