⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 newscontentfilter.java

📁 用来为垂直搜索引擎抓取数据的采集系统
💻 JAVA
字号:
/*
 * *****************************************************
 * Copyright (c) 2005 IIM Lab. All  Rights Reserved.
 * Created by xuehao at Dec 1, 2005
 * Contact: zxuehao@mail.ustc.edu.cn
 * *****************************************************
 */
package org.indigo.db.fieldfilter;

import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.indigo.util.*;
/**
 * 在采集新闻时,用到的一个类,主要是把和config中NewsRE中的参数值匹配的正则表达式内容去掉。
 * @author wbz
 *
 */
public class NewsContentFilter
{
    private static NewsContentFilter itsInstance=new NewsContentFilter();
    private NewsContentFilter()
    {
        
    }
    public static NewsContentFilter getInstance()
    {
        return itsInstance;
    }
    public String filter( String str )
    {
        String reText = MainConfig.getInstance().getProperty( "NewsRE" );
//        System.out.println( reText );
        
        Pattern p = Pattern.compile( reText, Pattern.CASE_INSENSITIVE );
        Matcher m = null;
        m = p.matcher( str );
        str = m.replaceAll( "" );
        return str;
    }
}

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -