⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 filtgtlt.java

📁 用来为垂直搜索引擎抓取数据的采集系统
💻 JAVA
字号:
/*
 * *****************************************************
 * Copyright (c) 2005 IIM Lab. All  Rights Reserved.
 * Created by xuehao at 2005-10-12
 * Contact: zxuehao@mail.ustc.edu.cn
 * *****************************************************
 */

package org.indigo.filters;

import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
 * 此类主要是把采集数据中的&gt;或者&lt;标签替换为>或者<标签。
 * @author wbz
 *
 */

public class FiltGtLt implements Filter
{

	/**
	 * 此函数主要是用正则表达式来实现。
	 */
    public String filt(String str)
    {
        Pattern p = null;
        Matcher m = null;
        
        p = Pattern.compile("&gt;");
        m = p.matcher(  str );
        str = m.replaceAll(">");
        
        p = Pattern.compile("&lt;");
        m = p.matcher(  str );
        str = m.replaceAll("<");

        return str;
    }
    
}

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -