⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 google.weblogsinc.com.script

📁 垂直搜索的网络爬虫
💻 SCRIPT
字号:
FIND_NODE	... <div id=~/p\d+/>	[next][END_OF_DOCUMENT]
FIND_NODE	... <h2>	[next][END_OF_DOCUMENT]
STORE_TEXT	title	-1	-1	[next][END_OF_DOCUMENT]
FIND_NODE	... <p class="byline">	[next][END_OF_DOCUMENT]
SAVE_TEXT	$meta	-1	-1	[next][END_OF_DOCUMENT]
REGEXP	$meta	/Posted\s+(.*) by/	[next][END_OF_DOCUMENT]
STORE_ISODATE	iso-date	MMM dd'th' yyyy hh:mma	$1	[GOTO_TASK	11][next]
STORE_ISODATE	iso-date	MMM dd'rd' yyyy hh:mma	$1	[GOTO_TASK	11][next]
STORE_ISODATE	iso-date	MMM dd'nd' yyyy hh:mma	$1	[GOTO_TASK	11][next]
STORE_ISODATE	iso-date	MMM dd'st' yyyy hh:mma	$1	[GOTO_TASK	11][END_OF_DOCUMENT]
FIND_NODE	... <div class="post">	[next][END_OF_DOCUMENT]
STORE_TEXT	content	-1	-1	[next][END_OF_DOCUMENT]
STORE_LINKS	-1	-1	[next][END_OF_DOCUMENT]
END_OF_ARTICLE		[next][END_OF_DOCUMENT]
GOTO_TASK	1	[][]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -