首页 › 资源下载 › Java编程 › 解析html网页 › 源码查看

getcontent1.java

来自「解析html网页」· Java 代码 · 共 75 行

JAVA

75 行

package com.unison.learn.http.wxx.main;

import java.io.*;
import java.net.*;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class GetContent1 {

	public static String content() throws Exception {

		String resultStr = new String();

		URL url = new URL("http://youxi.zol.com.cn/pc/index4869.html");
		URLConnection connection = url.openConnection();

		BufferedReader in = new BufferedReader(new InputStreamReader(connection
				.getInputStream()));
	
		int read_rst = in.read();
		StringBuffer readBuffer = new StringBuffer();
		
		while (-1 != read_rst) {
			
			char singleChar = (char) read_rst;
			readBuffer.append(singleChar);
			read_rst = in.read();
		}
		in.close();
		return resultStr = readBuffer.toString();
		
		//System.out.println(resultStr);
	}
	
	public String getList(final String s)  
	 {  
		String theList =null;
	  String regex;  
	  String title = "";  
	  final List<String> list = new ArrayList<String>();  
	  regex = "<div class=\"Ar mt0\"  style=\"padding:0 0 0 8px\">.*?</div>";  
	  final Pattern pa = Pattern.compile(regex, Pattern.CANON_EQ);  
	  final Matcher ma = pa.matcher(s);  
	  if (ma.find())  
	  {  
	 theList = ma.group();  
	  }  
	  System.out.println(theList);
	  
	  
	return  theList;  
	 }  
	
	
	public String outTag(final String s)  
	 {  
	  return s.replaceAll("<.*?>", "");  
	 }  

	
	public static void main(String args[]) throws Exception {
		
		content();
		GetContent1 gc =new GetContent1();
		System.out.println("==================================================");
		String htmlContent = null;
		htmlContent = content();
		String title =gc.getList(htmlContent);
		System.out.println(title);

	}
}

getcontent1.java - 源码说明

本页面展示了「解析html网页」中的 getcontent1.java 源码文件，采用 Java 编程语言编写，共 75 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与html相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?