⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 html2ascii.java

📁 一款很好的网络爬虫软件
💻 JAVA
字号:
import java.io.*;

public class HTML2ASCII extends FilterInputStream
{
	public HTML2ASCII(InputStream in){
		super(in);
	}

	/**
		Metode que llegeix d'un InputStream filtrant els tags que estan entre "<" i ">".
		@return retorna l'enter llegit
	*/

	public int read() throws IOException{
		int b = in.read();
		boolean flag1=false, flag2=false, nocomm=false;
		while (b == 60){
			b=in.read();
			if(b==-1) return b;
			if(b==33){			//   Caracter !
			  b=in.read();
			  if(b==-1) return b;
			  if(b==45){			//   Caracter -
				b=in.read();
				if(b==-1) return b;
				if(b==45){			//   Caracter -
					do{
						b=in.read();
						if(b==-1) return b;
						if(b==45){
							if(flag1) flag2=true;
							else flag1=true;
						} else {
							if(flag1 && flag2 && b==62);
							else {
								flag1=false;
								flag2=false;
							}
						}
					}while((!flag1)||(!flag2)||(b!=62));
				} else nocomm=true;
			  } else nocomm=true;
			} else nocomm=true;

			if(nocomm) {
				while(b!=62){
					b=in.read();
					if(b==-1) return b;
				}
			}
			b=in.read();
		}
		return b;
	}
}

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -