📄 manual.parselink
字号:
ParseLink for the CWT100g程序使用文档2005-04-09 by YHF所有程序代码是在linux环境下调试通过. 欢迎大家提供相应的window版本.一、名词约定以下名词在程序名和参数名中出现:Raw: 原始网页库,文件名必须以"Tianwang.raw."开头.Src: 表示将要读取的源文件,如SrcFile.Dest: 表示将要写入的目标文件,即程序将要生成的文件,如DestFile.二、程序约定程序都需要指定参数,如果不带参数运行,则显示该程序的一段简要说明.在不清楚程序运行参数的情况下,不带参数运行一下,可以了解该程序的使用方法.三、详细说明1. ParseLink: 该程序从一个Raw文件中提取出每个网页标识的urls.usage: ParseLink RawDataFile说明:提取出的links保存在文件"url."+RawDataFile中. 2. ParseLink_d: 该程序将整个目录下的Raw文件串行提取links,避免一个一个文件操作.usage: ParseLink_d DestDbDir RawDataDir说明:该程序调用上述程序ParseLink。所以必须确保ParseLink在PATH指定的目录下,如$HOME/bin下.
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -