⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 edit_title.htm

📁 mv 具体不是很清楚
💻 HTM
字号:
<!--
<?php
print <<<EOT
--><table width='100%' cellspacing='1' cellpadding='3' class="tablewidth">
  <tr>
    <td>[<a href="?lfj=gather&job=list">所有参数列表</a>] [<a href="?lfj=gather&job=add_title">增加新项目</a>] 
      [<a href="?lfj=gather&job=edit_title&id=$id">修改标题参数</a>] [<a href="?lfj=gather&job=edit_content&id=$id">修改内容参数</a>]</td>
  </tr>
</table><br>
<table width="100%" border="0" cellpadding="3" cellspacing="1" class="tablewidth">
  <form name="formse" id="formse" method="post" action="?lfj=$lfj&action=$job&id=$id" >
    <tr class="head" bgcolor="#FFFFFF"> 
      <td colspan="2">&nbsp;</td>
    </tr>
    <tr bgcolor="#FFFFFF"> 
      <td width="40%">采集的网站名称:</td>
      <td width="60%"> 
        <input type="text" name="webname" size="40" value="$webname">
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr">
      <td width="40%">网站编码选择:</td>
      <td width="60%">
        <input type="radio" name="charset_type" value="0" $charset_typedb[0] >
        gbk-&gt;gbk 
        <input type="radio" name="charset_type" value="1" $charset_typedb[1]>
        utf8-&gt;gbk</td>
    </tr>
    <tr bgcolor="#E7E7E7" align="center"> 
      <td colspan="2"> 
        <input type="radio" name="rulepage" value="0" checked id="rulepage0" onclick="show_rulepage(0)">
        手工输入多页 
        <input type="radio" name="rulepage" value="1" id="rulepage1" onclick="show_rulepage(1)">
        有规则的连续多页</td>
    </tr>
    <tr bgcolor="#FFFFFF" class="morepagenorule"> 
      <td width="40%" bgcolor="#FFFFFF">文章列表有多页,每页换一行<font color="#FF0000"><br>
        <br>
        </font>比较傻瓜化,没规则的标题列表页可以在此输入,而有规则的也可以手工在此一页一页的输入</td>
      <td width="60%"> 
        <textarea name="listmoreurl" cols="70" rows="11">$listmoreurl</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="morepagerule"> 
      <td width="40%">要采集的文章列表网址: (请把每页网址中变动那个数值即页码用<font color="#FF0000">[page]</font>代替)<font color="#FF0000"><br>
        </font>比如:<br>
        http://php168.com/1/list_<font color="#FF0000">1</font>.htm <br>
        http://php168.com/1/list_<font color="#FF0000">2</font>.htm<br>
        那右边应该填入<br>
        http://php168.com/1/list_<font color="#FF0000">[page]</font>.htm </td>
      <td width="60%"> 
        <input type="text" name="listurl" value="$listurl" size="70">
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="morepagerule"> 
      <td width="40%">请写出开始页码数值,结尾页页码数值<font color="#FF0000">(必填)</font></td>
      <td width="60%">开始第几页 
        <input name="page_begin" type="text" id="atc_page1" value="$page_begin" size="5">
        结束第几页 
        <input name="page_end" type="text" id="atc_page2" value="$page_end" size="5">
        <br>
        梯度 
        <input name="page_step" type="text" id="atc_page2" value="$page_step" size="5">
        默认1,如果想跳页,你可以写2,3,....</td>
    </tr>
    <tr bgcolor="#FFFFFF" class="morepagerule"> 
      <td width="40%">如果第一页没规则,请单独在此写出来第一页的网址:<br>
        比如第一页不是这个页,即不能访问<br>
        http://php168.com/1/list_<font color="#FF0000">1</font>.htm<br>
        但 <br>
        http://php168.com/1/list.htm<br>
        能访问,此时就在右边输入没规则的第一页</td>
      <td width="60%"> 
        <input type="text" name="firstpage" value="$firstpage" size="70">
      </td>
    </tr>
    <tr bgcolor="#FFFFFF"> 
      <td width="40%">自定义正则语法规则:<br>
        此项可以很精确的分析到要采集的数据,<b><font color="#0000FF">填写后,下面三项建议清空</font></b>.<br>
        举例比如网页中的html代码如下<br>
        &lt;tr&gt;&lt;td&gt;&lt;img src=&quot;<font color="#FF00FF">图片地址</font>&quot;&gt;&lt;a 
        href=&quot;<font color="#FF0000">内容页URL地址</font>&quot; title=&quot;<font color="#0000FF">注释信息</font>&quot;&gt;<font color="#FF0000">视频标题</font>&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;<br>
        那么左边输入<br>
        &lt;tr&gt;&lt;td&gt;&lt;img src=&quot;<font color="#FF00FF" title="点击即可实现复制" onClick="javascript:CopyText(this);">{picurl=NO&quot;}</font>&quot;&gt;&lt;a 
        href=&quot;<font color="#FF0000" title="点击即可实现复制" onClick="javascript:CopyText(this);">{url=NO&quot;}</font>&quot; 
        title=&quot;<font color="#0000FF" title="点击即可实现复制" onClick="javascript:CopyText(this);">{NO&quot;}</font>&quot;&gt;<font color="#FF0000" title="点击即可实现复制" onClick="javascript:CopyText(this);">{title=NO&lt;}</font>&lt;/a&gt;&lt;/td&gt;&lt;/tr&gt;<br>
        其中<font color="#FF0000">{url=NO&quot;}</font>的意义是地址等于不包含有<font color="#FF0000">&quot;</font>双引号的所有字符串<br>
        其中<font color="#FF0000">{title=NO&lt;}</font>的意义是标题等于不包含有<font color="#FF0000">&lt;</font>号的所有字符串<br>
        其中<font color="#0000FF">{NO&quot;}</font>的意义代表不包含有<font color="#0000FF">&quot;</font>号的所有字符串,为何他前面没有等号?那是因为不考虑取他的值,因为每个标题的title都不一样.所以这里要给他定义一个正则语法.其他固定的格式就不必处理了<br>
        注:NO后面可以写上任何字符,可多个,但不能为中文,<br>
        例如:<font color="#FF0000">{url=NO' &quot;=&lt;&gt;}</font>代表除<font color="#FF0000">' 
        &quot;=&lt;&gt;</font>他们之外的所有字符串</td>
      <td width="60%"> 
        <textarea name="title_rule" cols="80" rows="12">$title_rule</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">url链接地址及标题中不能包含的字符<font color="#FF0000"><br>
        </font>一般情况都必填<font color="#FF0000"><b>&lt;<br>
        </b></font>多个请换行<br>
        (目的是过滤太多无用的链接地址) </td>
      <td width="60%"> 
        <textarea name="link_noinclude_word" cols="70" rows="7">$link_noinclude_word</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">标题不能小于几个字符(常用):<br>
        留空不做限制,一个汉字相当于两个字符,一般输入8<br>
        (目的,有效过滤太短的标题也即是无用的链接) </td>
      <td width="60%"> 
        <input type="text" name="title_minleng" size="4" value="$title_minleng">
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">url链接地址中必须包含的字符<br>
        多个请换行 <br>
        (目的也是过滤太多无用的链接地址) </td>
      <td width="60%"> 
        <textarea name="link_include_word" cols="70" rows="7">$link_include_word</textarea>
      </td>
    </tr>
    <tr bgcolor="#E7E7E7" align="center"> 
      <td colspan="2"> 
        <input type="checkbox" name="suset" value="checkbox"  onclick="show_more(0)">
        显示不常用的高级设置(<font color="#0000FF">一般不用</font>)</td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">替换标题链接地址中的字符<br>
        (一般留空,目的是有些链接地址比较怪僻,点击默认的不能访问那个内容页,不过情况极少出现.) </td>
      <td width="60%"> 
        <textarea name="link_replace_word" cols="70" rows="7">$link_replace_word</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">替换标题中的字符<br>
        (一般留空,目的是过滤某些标题中不想见到的文字) </td>
      <td width="60%"> 
        <textarea name="title_replace_word" cols="70" rows="7">$title_replace_word</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">欲截取页面中的指定部分的标题链接地址,此部分标题在整个页面HTML代码所在位置之前唯一出现的字符串<br>
        <br>
        (目的,去除指定标题之前无用信息,更准确无误的采集指定标题链接地址) </td>
      <td width="60%"> 
        <textarea name="list_begin_code" cols="70" rows="7">$list_begin_code</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">欲截取页面中的指定部分的标题链接地址,此部分标题在整个页面HTML代码所在位置之后最先出现的字符串,但不在标题所在html代码里出现过<br>
        <br>
        (目的,去除指定标题之后的无用信息,更准确无误的采集指定标题链接地址) </td>
      <td width="60%"> 
        <textarea name="list_end_code" cols="70" rows="7">$list_end_code</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">开头正则语法程序<br>
        <br>
        <br>
        (适合处理采集比较怪僻的网站.不懂PHP程序的,请留空,否则会出现严重问题使得采集程序无法运行) </td>
      <td width="60%"> 
        <textarea name="list_begin_preg" cols="70" rows="7">$list_begin_preg</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">结尾正则语法程序<br>
        <br>
        (适合处理采集比较怪僻的网站.不懂PHP程序的,请留空,否则会出现严重问题使得采集程序无法运行) </td>
      <td width="60%"> 
        <textarea name="list_end_preg" cols="70" rows="7">$list_end_preg</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF"> 
      <td width="40%"> 
        <input type="hidden" name="testgather">
        <input type="hidden" name="posttime" value="$timestamp">
      </td>
      <td width="60%"> 
        <input type="button" name="Submit" value="提交" onclick="post(0);">
        <input type="button" name="Submit2" value="测试采集标题" onclick="post(1);">
        (最好先测试,觉得满意后,再提交) </td>
    </tr>
  </form>
</table>
<SCRIPT LANGUAGE="JavaScript">
<!--
function post(va){
	if(va==1){
		document.formse.target="_blank";
	}else{
		document.formse.target="";
	}
	document.formse.testgather.value=va
	document.formse.submit();
}

function show_rulepage(va){
	var s=document.getElementsByTagName("tr");
	for(var i=0;i<s.length;i++){
		if( formse.rulepage1.checked==true ||va==1 ){
			if(s[i].className=='morepagerule'){
				s[i].style.display="";
			}
			if(s[i].className=='morepagenorule'){
				s[i].style.display="none";
			}
			formse.rulepage1.checked=true;
			formse.rulepage0.checked=false;
			document.formse.listmoreurl.disabled=true;	
		}else{
			if(s[i].className=='morepagerule'){
				s[i].style.display="none";
			}
			if(s[i].className=='morepagenorule'){
				s[i].style.display="";
			}
			formse.rulepage1.checked=false;
			formse.rulepage0.checked=true;
			document.formse.listmoreurl.disabled=false;	
		}
	}
}
show_rulepage($rulepage);
function show_more(va){
	var s=document.getElementsByTagName("tr");
	for(var i=0;i<s.length;i++){
		if( document.formse.suset.checked==true ||va==1 ){
			if(s[i].className=='susettr'){
				s[i].style.display="";
			}	
		}else{
			if(s[i].className=='susettr'){
				s[i].style.display="none";
			}	
		}
	}
}
//位置必须放在最底下
show_more(0);
//-->
</SCRIPT>

<script language="Javascript">
function CopyText(obj) {
	ie = (document.all)? true:false
	if (ie){
		var rng = document.body.createTextRange();
		rng.moveToElementText(obj);
		rng.scrollIntoView();
		rng.select();
		rng.execCommand("Copy");
		rng.collapse(false);
		alert(obj.innerText+'被复制成功');
	}
}
</script>
<!--
EOT;
?>
-->

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -