manual.parselink

来自「此源码功能是捕获网页中的链接并进行分析」· PARSELINK 代码 · 共 25 行

PARSELINK
25
字号
ParseLink for the CWT100g程序使用文档2005-04-09 by YHF所有程序代码是在linux环境下调试通过. 欢迎大家提供相应的window版本.一、名词约定以下名词在程序名和参数名中出现:Raw: 原始网页库,文件名必须以"Tianwang.raw."开头.Src: 表示将要读取的源文件,如SrcFile.Dest: 表示将要写入的目标文件,即程序将要生成的文件,如DestFile.二、程序约定程序都需要指定参数,如果不带参数运行,则显示该程序的一段简要说明.在不清楚程序运行参数的情况下,不带参数运行一下,可以了解该程序的使用方法.三、详细说明1. ParseLink: 该程序从一个Raw文件中提取出每个网页标识的urls.usage: ParseLink RawDataFile说明:提取出的links保存在文件"url."+RawDataFile中. 2. ParseLink_d: 该程序将整个目录下的Raw文件串行提取links,避免一个一个文件操作.usage:   ParseLink_d DestDbDir RawDataDir说明:该程序调用上述程序ParseLink。所以必须确保ParseLink在PATH指定的目录下,如$HOME/bin下.

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?