📄 extract.pl
字号:
open(In,"sohu.html");
$ISMeet=0;
while(<In>){
chomp;
if ( /<!-- 国内国际新闻 -->/ ){
$ISMeet=1;
next;
}
if ( $ISMeet == 1 ){
s/<font[^>]*>//g;
s/<\/font>//g;
s/<b>//g;
s/<\/b>//g;
s/<br>//g;
if (/^·(.*)/){
$TitleLink=$1;
@Links=$TitleLink=~/href="([^"]+)"/g;
@Titles=$TitleLink=~/<[aA][^>]+>([^<>]+)<\/[aA]>/g;
for ($i=0;$i<@Links;$i++){
print "$Titles[$i]\t=>$Links[$i]\n";
}
print "";
}
}
if ( /<!-- end 国内国际新闻 -->/ ){
last;
}
}
close(In);
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -