📄 edit_title.htm
字号:
<!--
<?php
print <<<EOT
--><table width='100%' cellspacing='1' cellpadding='3' class="tablewidth">
<tr>
<td>[<a href="?lfj=gather&job=list">所有参数列表</a>] [<a href="?lfj=gather&job=add_title">增加新项目</a>]
[<a href="?lfj=gather&job=edit_title&id=$id">修改标题参数</a>] [<a href="?lfj=gather&job=edit_content&id=$id">修改内容参数</a>]</td>
</tr>
</table><br>
<table width="100%" border="0" cellpadding="3" cellspacing="1" class="tablewidth">
<form name="formse" id="formse" method="post" action="?lfj=$lfj&action=$job&id=$id" >
<tr class="head" bgcolor="#FFFFFF">
<td colspan="2"> </td>
</tr>
<tr bgcolor="#FFFFFF">
<td width="40%">采集的网站名称:</td>
<td width="60%">
<input type="text" name="webname" size="40" value="$webname">
</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">网站编码选择:</td>
<td width="60%">
<input type="radio" name="charset_type" value="0" $charset_typedb[0] >
gbk->gbk
<input type="radio" name="charset_type" value="1" $charset_typedb[1]>
utf8->gbk</td>
</tr>
<tr bgcolor="#E7E7E7" align="center">
<td colspan="2">
<input type="radio" name="rulepage" value="0" checked id="rulepage0" onclick="show_rulepage(0)">
手工输入多页
<input type="radio" name="rulepage" value="1" id="rulepage1" onclick="show_rulepage(1)">
有规则的连续多页</td>
</tr>
<tr bgcolor="#FFFFFF" class="morepagenorule">
<td width="40%" bgcolor="#FFFFFF">文章列表有多页,每页换一行<font color="#FF0000"><br>
<br>
</font>比较傻瓜化,没规则的标题列表页可以在此输入,而有规则的也可以手工在此一页一页的输入</td>
<td width="60%">
<textarea name="listmoreurl" cols="70" rows="11">$listmoreurl</textarea>
</td>
</tr>
<tr bgcolor="#FFFFFF" class="morepagerule">
<td width="40%">要采集的文章列表网址: (请把每页网址中变动那个数值即页码用<font color="#FF0000">[page]</font>代替)<font color="#FF0000"><br>
</font>比如:<br>
http://php168.com/1/list_<font color="#FF0000">1</font>.htm <br>
http://php168.com/1/list_<font color="#FF0000">2</font>.htm<br>
那右边应该填入<br>
http://php168.com/1/list_<font color="#FF0000">[page]</font>.htm </td>
<td width="60%">
<input type="text" name="listurl" value="$listurl" size="70">
</td>
</tr>
<tr bgcolor="#FFFFFF" class="morepagerule">
<td width="40%">请写出开始页码数值,结尾页页码数值<font color="#FF0000">(必填)</font></td>
<td width="60%">开始第几页
<input name="page_begin" type="text" id="atc_page1" value="$page_begin" size="5">
结束第几页
<input name="page_end" type="text" id="atc_page2" value="$page_end" size="5">
<br>
梯度
<input name="page_step" type="text" id="atc_page2" value="$page_step" size="5">
默认1,如果想跳页,你可以写2,3,....</td>
</tr>
<tr bgcolor="#FFFFFF" class="morepagerule">
<td width="40%">如果第一页没规则,请单独在此写出来第一页的网址:<br>
比如第一页不是这个页,即不能访问<br>
http://php168.com/1/list_<font color="#FF0000">1</font>.htm<br>
但 <br>
http://php168.com/1/list.htm<br>
能访问,此时就在右边输入没规则的第一页</td>
<td width="60%">
<input type="text" name="firstpage" value="$firstpage" size="70">
</td>
</tr>
<tr bgcolor="#FFFFFF">
<td width="40%">自定义正则语法规则:<br>
此项可以很精确的分析到要采集的数据,<b><font color="#0000FF">填写后,下面三项建议清空</font></b>.<br>
举例比如网页中的html代码如下<br>
<tr><td><img src="<font color="#FF00FF">图片地址</font>"><a
href="<font color="#FF0000">内容页URL地址</font>" title="<font color="#0000FF">注释信息</font>"><font color="#FF0000">视频标题</font></a></td></tr><br>
那么左边输入<br>
<tr><td><img src="<font color="#FF00FF" title="点击即可实现复制" onClick="javascript:CopyText(this);">{picurl=NO"}</font>"><a
href="<font color="#FF0000" title="点击即可实现复制" onClick="javascript:CopyText(this);">{url=NO"}</font>"
title="<font color="#0000FF" title="点击即可实现复制" onClick="javascript:CopyText(this);">{NO"}</font>"><font color="#FF0000" title="点击即可实现复制" onClick="javascript:CopyText(this);">{title=NO<}</font></a></td></tr><br>
其中<font color="#FF0000">{url=NO"}</font>的意义是地址等于不包含有<font color="#FF0000">"</font>双引号的所有字符串<br>
其中<font color="#FF0000">{title=NO<}</font>的意义是标题等于不包含有<font color="#FF0000"><</font>号的所有字符串<br>
其中<font color="#0000FF">{NO"}</font>的意义代表不包含有<font color="#0000FF">"</font>号的所有字符串,为何他前面没有等号?那是因为不考虑取他的值,因为每个标题的title都不一样.所以这里要给他定义一个正则语法.其他固定的格式就不必处理了<br>
注:NO后面可以写上任何字符,可多个,但不能为中文,<br>
例如:<font color="#FF0000">{url=NO' "=<>}</font>代表除<font color="#FF0000">'
"=<></font>他们之外的所有字符串</td>
<td width="60%">
<textarea name="title_rule" cols="80" rows="12">$title_rule</textarea>
</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">url链接地址及标题中不能包含的字符<font color="#FF0000"><br>
</font>一般情况都必填<font color="#FF0000"><b><<br>
</b></font>多个请换行<br>
(目的是过滤太多无用的链接地址) </td>
<td width="60%">
<textarea name="link_noinclude_word" cols="70" rows="7">$link_noinclude_word</textarea>
</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">标题不能小于几个字符(常用):<br>
留空不做限制,一个汉字相当于两个字符,一般输入8<br>
(目的,有效过滤太短的标题也即是无用的链接) </td>
<td width="60%">
<input type="text" name="title_minleng" size="4" value="$title_minleng">
</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">url链接地址中必须包含的字符<br>
多个请换行 <br>
(目的也是过滤太多无用的链接地址) </td>
<td width="60%">
<textarea name="link_include_word" cols="70" rows="7">$link_include_word</textarea>
</td>
</tr>
<tr bgcolor="#E7E7E7" align="center">
<td colspan="2">
<input type="checkbox" name="suset" value="checkbox" onclick="show_more(0)">
显示不常用的高级设置(<font color="#0000FF">一般不用</font>)</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">替换标题链接地址中的字符<br>
(一般留空,目的是有些链接地址比较怪僻,点击默认的不能访问那个内容页,不过情况极少出现.) </td>
<td width="60%">
<textarea name="link_replace_word" cols="70" rows="7">$link_replace_word</textarea>
</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">替换标题中的字符<br>
(一般留空,目的是过滤某些标题中不想见到的文字) </td>
<td width="60%">
<textarea name="title_replace_word" cols="70" rows="7">$title_replace_word</textarea>
</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">欲截取页面中的指定部分的标题链接地址,此部分标题在整个页面HTML代码所在位置之前唯一出现的字符串<br>
<br>
(目的,去除指定标题之前无用信息,更准确无误的采集指定标题链接地址) </td>
<td width="60%">
<textarea name="list_begin_code" cols="70" rows="7">$list_begin_code</textarea>
</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">欲截取页面中的指定部分的标题链接地址,此部分标题在整个页面HTML代码所在位置之后最先出现的字符串,但不在标题所在html代码里出现过<br>
<br>
(目的,去除指定标题之后的无用信息,更准确无误的采集指定标题链接地址) </td>
<td width="60%">
<textarea name="list_end_code" cols="70" rows="7">$list_end_code</textarea>
</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">开头正则语法程序<br>
<br>
<br>
(适合处理采集比较怪僻的网站.不懂PHP程序的,请留空,否则会出现严重问题使得采集程序无法运行) </td>
<td width="60%">
<textarea name="list_begin_preg" cols="70" rows="7">$list_begin_preg</textarea>
</td>
</tr>
<tr bgcolor="#FFFFFF" class="susettr">
<td width="40%">结尾正则语法程序<br>
<br>
(适合处理采集比较怪僻的网站.不懂PHP程序的,请留空,否则会出现严重问题使得采集程序无法运行) </td>
<td width="60%">
<textarea name="list_end_preg" cols="70" rows="7">$list_end_preg</textarea>
</td>
</tr>
<tr bgcolor="#FFFFFF">
<td width="40%">
<input type="hidden" name="testgather">
<input type="hidden" name="posttime" value="$timestamp">
</td>
<td width="60%">
<input type="button" name="Submit" value="提交" onclick="post(0);">
<input type="button" name="Submit2" value="测试采集标题" onclick="post(1);">
(最好先测试,觉得满意后,再提交) </td>
</tr>
</form>
</table>
<SCRIPT LANGUAGE="JavaScript">
<!--
function post(va){
if(va==1){
document.formse.target="_blank";
}else{
document.formse.target="";
}
document.formse.testgather.value=va
document.formse.submit();
}
function show_rulepage(va){
var s=document.getElementsByTagName("tr");
for(var i=0;i<s.length;i++){
if( formse.rulepage1.checked==true ||va==1 ){
if(s[i].className=='morepagerule'){
s[i].style.display="";
}
if(s[i].className=='morepagenorule'){
s[i].style.display="none";
}
formse.rulepage1.checked=true;
formse.rulepage0.checked=false;
document.formse.listmoreurl.disabled=true;
}else{
if(s[i].className=='morepagerule'){
s[i].style.display="none";
}
if(s[i].className=='morepagenorule'){
s[i].style.display="";
}
formse.rulepage1.checked=false;
formse.rulepage0.checked=true;
document.formse.listmoreurl.disabled=false;
}
}
}
show_rulepage($rulepage);
function show_more(va){
var s=document.getElementsByTagName("tr");
for(var i=0;i<s.length;i++){
if( document.formse.suset.checked==true ||va==1 ){
if(s[i].className=='susettr'){
s[i].style.display="";
}
}else{
if(s[i].className=='susettr'){
s[i].style.display="none";
}
}
}
}
//位置必须放在最底下
show_more(0);
//-->
</SCRIPT>
<script language="Javascript">
function CopyText(obj) {
ie = (document.all)? true:false
if (ie){
var rng = document.body.createTextRange();
rng.moveToElementText(obj);
rng.scrollIntoView();
rng.select();
rng.execCommand("Copy");
rng.collapse(false);
alert(obj.innerText+'被复制成功');
}
}
</script>
<!--
EOT;
?>
-->
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -