⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 linkparser.java

📁 自己写的JAVA版提取指定网址所有超连接的实例
💻 JAVA
字号:


import java.util.regex.Pattern;
import java.util.regex.Matcher;
import java.util.ArrayList;

public class LinkParser {
public static ArrayList al = new ArrayList();

public static void parser(String string) {
String regex = "<\\s*a\\s*([^>]*)\\s*href\\s*=\\s*([^>]*)\\s*>";
Pattern p = Pattern.compile(regex);
Matcher m = p.matcher(string);

if(m.find()) {
al.add(m.group());
//System.out.println(m.group());
if(string.length()> m.end()) {
parser(string.substring(m.end()));
}
}
}

public static ArrayList getResultList() {
return al;
}

public static void cleanList() {
al.clear();
}

//public static void main(String[] args) {
//
//LinkGrabber lg = new LinkGrabber();
//LinkParser.parser(lg.linkGrabber("http://www.sohu.com"));
//ArrayList resultList = LinkParser.getResultList();
////LinkParser.cleanList();
////System.out.println("共找到了" + resultList.size() + "个?接!");
//for(int i = 0;i< resultList.size();i ++) {
//System.out.println(resultList.get(i).toString());
//}
//}
}

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -