filtgtlt.java
来自「用来为垂直搜索引擎抓取数据的采集系统」· Java 代码 · 共 42 行
JAVA
42 行
/*
* *****************************************************
* Copyright (c) 2005 IIM Lab. All Rights Reserved.
* Created by xuehao at 2005-10-12
* Contact: zxuehao@mail.ustc.edu.cn
* *****************************************************
*/
package org.indigo.filters;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 此类主要是把采集数据中的>或者<标签替换为>或者<标签。
* @author wbz
*
*/
public class FiltGtLt implements Filter
{
/**
* 此函数主要是用正则表达式来实现。
*/
public String filt(String str)
{
Pattern p = null;
Matcher m = null;
p = Pattern.compile(">");
m = p.matcher( str );
str = m.replaceAll(">");
p = Pattern.compile("<");
m = p.matcher( str );
str = m.replaceAll("<");
return str;
}
}
⌨️ 快捷键说明
复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?