📄 admin_itemaddnew.asp
字号:
<!-- #include file="../conn.asp" -->
<!--#include file="../inc/config.asp"-->
<!-- #include file="session.asp" -->
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<link rel="stylesheet" type="text/css" href="css.css">
<script language="javaScript" src="images/plus.js"></script>
<link rel="stylesheet" type="text/css" href="helpalt.css">
<script language="JavaScript">
function checkWebUrl()
{
var WebName = document.myform.WebName;
var WebUrl = document.myform.WebUrl;
if (WebName.value && WebUrl.value) {
window.open("admin_checkWebUrl.asp?info=Itemadd&WebName="+WebName.value+"&WebUrl="+WebUrl.value,"_blank","top=50,left=80,height=500,width=550,status=no,toolbar=no,menubar=no,location=no")
}
else {
alert("CnEndWeb(终点)提醒:\n\n请先填写好网站名称、网站网址!");
WebName.focus();
}
}
</script>
</head>
<body leftmargin="0" topmargin="0" marginwidth="0" marginheight="0">
<div id="topmomo">
长篇采集系统项目管理</div>
<table width="100%" border="0" align="center" cellpadding="0" cellspacing="1" class="tborder">
<tr align="center">
<td height="30"><a href="Admin_ItemManage.asp">管理首页</a> >>
<a href="Admin_ItemAddNew.asp">添加项目</a> >> <font color="red">基本设置</font>
>> 资料页设置 >> 目录页设置 >> 分卷/章节页设置 >> 章节采样测试 >> 其他设置 >> 完成</td>
</tr>
</table>
<table width="100%" border="0" align="center" cellpadding="0" cellspacing="1" class="tborder" style="LINE-HEIGHT: 150%">
<form method="post" action="Admin_ItemAddNew2.asp" name="myform">
<tr align="center">
<td colspan="3" align="center" class="thead">添 加 新 项 目--基 本 设 置</td>
</tr>
<tr>
<td width="25%" align="right" class="alt2">网站名称:</td>
<td class="alt1" width="73%">
<input name="WebName" type="text" size="26" maxlength="30" class="form">
要采集网站名称如 起点中文网</td>
<td class="alt1" valign="top" width="30">
<img border=0 alt="如何知晓该站的网站名称?
<hr width=500 height=1>浏览器标题栏显示的网站名称或其站点LOGO显示的名称
<img border=0 src=helpimg/Sitelogo.jpg width=155 height=55>" src=images/question.gif width=17 height=17>
</td>
</tr>
<tr>
<td width="25%" align="right" class="alt2">网站网址:</td>
<td class="alt1" width="73%">
<input name="WebUrl" type="text" size="30" maxlength="150" class="form"> <a onclick="checkWebUrl();" style="cursor:hand" class="form"><font color="red">检验本地服务器与目标站是否通信良好?</font></a> <br>
该网站的网址如 http://www.cmfu.com/</td>
<td class="alt1" valign="top" width="30">
<img border=0 alt="如何知晓该站的网站地址?
<hr width=500 height=1>网站地址一般就是该站的域名,一般填写首页地址,如果是该站的栏目频道则填写频道地址
使用浏览器打开该站,在地址栏显示的字符串即是该站网站地址:
<img border=0 src=helpimg/SiteUrl.jpg width=209 height=105>" src=images/question.gif width=17 height=17>
</td>
</tr>
<tr>
<td width="25%" align="right" class="alt2">页面编码:</td>
<td class="alt1" width="73%">
<input type="radio" value="gb2312" name="EquivType" checked class="form">GB2312
<input type="radio" value="gbk" name="EquivType" class="form">GBK
<input type="radio" value="utf-8" name="EquivType" class="form">UTF-8
</td>
<td class="alt1" valign="top" width="30">
<img border=0 alt="如何知晓该站的页面编码?
<hr width=500 height=1>首先使用浏览器打开该站的页面
然后查看该页面的源代码(查看==>源文件)
找到如下代码段中红色矩形框住的就是该站的页面编码了(不分大小写):
<img border=0 src=helpimg/sitecharset.jpg width=416 height=94>" src=images/question.gif width=17 height=17>
</td>
</tr>
<tr>
<td width="25%" align="right" class="alt2">网站登录:</td>
<td class="alt1" width="73%">
<input type="radio" value="0" name="LoginType" checked onclick="Login.style.display='none'" class="form">不需要登录
<input type="radio" value="1" name="LoginType" onclick="Login.style.display=''" class="form">设置参数<br>
需要登录才能访问的请设置登录参数(不支持验证码登录)</td>
<td class="alt1" valign="top" width="30">
<img border=0 alt="如何知晓该站是否需要设置网站登录?
<hr width=500 height=1>首先使用浏览器打开该站的页面
阅读作品(从资料页一直阅读到章节页)
如果有提示如下这种类似信息
“本站作品需要注册会员登陆后才能阅读”
则表明需要设置网站登录否则不用" src=images/question.gif width=17 height=17>
</td>
</tr>
<tr id="Login" style="display:none">
<td width="25%" align="right" class="alt2">登录参数:</td>
<td class="alt1" width="73%">登录地址:<input name="LoginUrl" type="text" size="40" maxlength="150" class="form"><br>
登陆页面的网址如 http://www.****.com/User_Login.asp<br>
<br>
提交地址:<input name="LoginPostUrl" type="text" size="40" maxlength="150" class="form"><br>
点击 登录 按钮后用来验证用户名、密码的文件网址如 http://www.****.com/User_ChkLogin.asp<br>
<br>
用户参数:<input name="LoginUser" type="text" size="30" maxlength="150" class="form"><br>
用户名:<input type="text" name="<font color="#FF0000">UserName</font>"
value=""><br>
用户参数就是--name=后面的"<font color="#FF0000">UserName</font>"+"="+"你的用户名"如
UserName=终点<br>
<br>
密码参数:<input name="LoginPass" type="text" size="30" maxlength="150" class="form"><br>
密码:<input type="password" name="<font color="#FF0000">Password</font>"
value=""><br>
密码参数就是--name=后面的"<font color="#FF0000">Password</font>"+"="+"你的密码"如
Password=cnendweb<br>
<br>
失败信息:<input name="LoginFalse" type="text" size="30" maxlength="150" class="form"><br>
用户名或者密码不正确时,登录后的失败提示信息,用于判断登录是否成功的一个标志 <br>
请一定要填写,否则不能采集,比如:您输入的用户名或密码不正确,请重新输入! </td>
<td class="alt1" valign="top" width="30">
</td>
</tr>
<tr>
<td width="25%" align="right" valign="top" class="alt2">作品<font color="#FF0000">资料页面</font>连接形式:</td>
<td class="alt1" width="73%">
<input type="radio" value="0" name="ShowType" checked onclick="Islisteds1.style.display='';Islisteds2.style.display='none';Islisteds3.style.display='';Islisteds4.style.display='';Islist1.style.display='none'" class="form">纯ID形式或单级目录
<input type="radio" value="1" name="ShowType" onclick="Islisteds1.style.display='none';Islisteds2.style.display='';Islisteds3.style.display='none';Islisteds4.style.display='';Islist1.style.display=''" class="form">多极目录、无规律目录或者是无规则文件名等
<br>纯ID格式例如:http://www.cmfu.com/showbook.asp?Bl_id=1或http://www.XXX.com/HTML/1.shtml<br>
单级目录格式例如:http://www.XXX.com/htmpage/33397/33397.htm<br>
多极目录格式例如:http://www.cuiweiju.com/htmpage/333/33397/index.htm<br>
无规律目录格式例如:http://blog.cnread.net/cnread1/netwx/y/yiming/dzsf/index.html<br>
无规则文件名格式例如:http://www.xxsy.net/wx/1_1_14.html<br>
</td>
<td class="alt1" valign="top" width="30">
<img border=0 alt="如何知晓该站的作品<font color=#FF0000>资料页面</font>连接形式?
<hr width=500 height=1>首先使用浏览器打开该站的作品资料页面
然后查看地址栏连接字符串
如果其连接字符串是类似以下形式
“http://www.XXX.com/showbook.asp?id=<font color=RED>117339</font>”
或“http://www.XXX.com/<font color=RED>117339</font>/<font color=RED>117339</font>.htm”
则作品资料页面是“纯ID形式或单级目录”
上面示例中的红色字表示的是该作品在目标站的id简称“目标站ID”
如果其连接字符串是类似以下形式
“http://www.XXX.com/cnread1/<font color=RED>netwx/y/yiming/dzsf</font>/index.html”
或“http://www.XXX.com/htmpage/<font color=RED>117/117339</font>.htm”
或“http://www.XXX.com/htmpage/<font color=RED>1_1_14</font>.htm”
则作品资料页面是“多极目录、无规律目录或者是无规则文件名等”
上面示例中的红色字表示的是该作品在目标站的Url简称“目标站Url”
" src=images/question.gif width=17 height=17>
</td>
</tr>
<tr>
<td width="25%" align="right" class="alt2">作品采集方式:</td>
<td class="alt1" width="73%"><div id="Islisteds1">
<input type="radio" value="0" name="Islisted" checked onclick="Islist.style.display=''" class="form">可按照ID列表或ID范围采集
<input type="radio" value="1" name="Islisted" onclick="Islist.style.display='none'" class="form">仅可按照ID范围采集 </div>
<div id="Islisteds2" style="display:none">
<input type="radio" value="2" name="Islisted" onclick="Islist.style.display=''" class="form">仅可按照URL列表采集 </div></td>
<td class="alt1" valign="top" width="30">
<img border=0 alt="如何判断该站可以采用那种作品采集方式?
<hr width=500 height=1>首先使用浏览器打开该站的作品资料页面
然后查看地址栏连接字符串
如果其连接字符串是类似以下形式
“http://www.XXX.com/showbook.asp?id=<font color=RED>117339</font>”
或“http://www.XXX.com/<font color=RED>117339</font>/<font color=RED>117339</font>.htm”
则可以选择“可按照ID列表或ID范围”或“仅可按照ID范围”采集
如果该站的目标站ID是规律性的则选择“可按照ID列表或ID范围”或“仅可按照ID范围”采集
如果该站的目标站ID不是规律性的则选择“可按照ID列表或ID范围”采集
如果其连接字符串是类似以下形式
“http://www.XXX.com/cnread1/<font color=RED>netwx/y/yiming/dzsf</font>/index.html”
或“http://www.XXX.com/htmpage/<font color=RED>117/117339</font>.htm”
或“http://www.XXX.com/htmpage/<font color=RED>1_1_14</font>.htm”
则只能选择“仅可按照URL列表”采集" src=images/question.gif width=17 height=17>
</td>
</tr>
<tr id="Islist">
<td colspan="3">
<table width="100%" border="1" align="center" cellpadding="0" cellspacing="0" bordercolor="#0650D2" bordercolordark="#FFFFFF" bgcolor="#D9D9D9">
<tr>
<td width="25%" align="right" class="alt1">列表获取方式:</td>
<td width="73%" class="alt2"><div id="Islisteds3">
<input type="radio" value="0" name="Islisted1" checked class="form" onclick="Islist1.style.display='none'">手工输入
</div><div id="Islisteds4">
<input type="radio" value="1" name="Islisted1" class="form" onclick="Islist1.style.display=''">可按照页面
(当选择“仅按照URL列表”时只能选择“按照页面”)</div> </td>
<td class="alt1" valign="top" width="30">
<img border=0 alt="如何选择列表获取方式?
<hr width=500 height=1>当作品采集方式选择了“可按照ID列表或ID范围采集”
一般默认的是“手工输入”作品id列表
该站有作品列表页面时也可以选择“可按照页面”截取作品id列表
当作品采集方式选择了“仅可按照URL列表采集”
则只能选择“可按照页面”截取作品URL列表
否则将无法进行下一步设计。
" src=images/question.gif width=17 height=17>
</td>
</tr>
<tr id="Islist1" style="display:none">
<td colspan="5">
<table width="100%" border="1" align="center" cellpadding="0" cellspacing="0" bordercolor="#0650D2" bordercolordark="#FFFFFF" bgcolor="#f0f0f0">
<tr height="22">
<td colspan="2">
测试作品列表页面地址:<input name="listedUrl" type="text" size="58" maxlength="200" class="form"><br>
</td>
<td class="alt1" valign="top" width="30">
<img border=0 alt="什么是测试作品列表页面地址?
<hr width=500 height=1>测试作品列表页面地址,顾名思义就是该站点显示作品列表的页面
如起点中文的作品列表可以填写
所有作品列表页面:http://www.cmfu.com/listupdate.asp?status=down
分类作品列表页面:http://www.cmfu.com/listbook.asp?Bl_class=12
全本作品列表页面:http://www.cmfu.com/listbookqb.asp
排行作品列表页面:http://www.cmfu.com/topten.asp
还有其他一些作品列表页面等,任选填写一个即可从所填写的作品列表页面获取作品ID/Url了
" src=images/question.gif width=17 height=17></td>
</tr>
<tr>
<td width="49%" align="center">作品列表页开始标记:<br>
<textarea name="ListPaingsString" cols="30" rows="5" class="form"></textarea></td>
<td width="49%" align="center">作品列表页结束标记:<br>
<textarea name="ListPaingoString" cols="30" rows="5" class="form"></textarea></td>
<td class="alt1" valign="top" width="30">
<img border=0 alt="什么是页面开始标记?
<hr width=500 height=1>打开该站的相关页面的源文件
查找该页面中需要截取的有效资料的前的一段特定的代码字符串作为该页面的开始标记
该标记在源文件中应该是“唯一”的或是“靠前第一位”的。
什么是在源文件中是“唯一”的?
从源文件中搜索该标记,只能搜索到<font color=RED>唯一</font>一个结果。
什么是在源文件中是“靠前第一位”的?
从源文件中搜索该标记搜索到<font color=RED>多个</font>结果时,该标记在<font color=RED>第一位</font>。
注:搜索应从上到下搜索页面源文件。
" src=images/question.gif width=17 height=17>
<img border=0 alt="什么是页面结束标记?
<hr width=500 height=1>打开该站的相关页面的源文件
查找该页面中需要截取的有效资料的后的一段特定的代码字符串作为该页面的结束标记
该标记在源文件中应该是“唯一”的或是“靠前第一位”的
什么是在源文件中是“唯一”的?
从源文件中搜索该标记,只能搜索到<font color=RED>唯一</font>一个结果。
什么是在源文件中是“靠前第一位”的?
从源文件中搜索该标记搜索到<font color=RED>多个</font>结果时,该标记在<font color=RED>第一位</font>
注:1、搜索应从上到下搜索页面源文件;2、从开始标记向后搜索。
" src=images/questions.gif width=17 height=17>
</td>
</tr>
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -