sitefilter.java

来自「用来为垂直搜索引擎抓取数据的采集系统」· Java 代码 · 共 47 行

JAVA
47
字号
/*
 * *****************************************************
 * Copyright (c) 2005 IIM Lab. All  Rights Reserved.
 * Created by xuehao at Dec 1, 2005
 * Contact: zxuehao@mail.ustc.edu.cn
 * *****************************************************
 */
package org.indigo.db.fieldfilter;

/**
 * 处理URL主要是获取一个URL中的站点域名。
 * @author wbz
 *
 */
public class SiteFilter
{
    private static SiteFilter itsInstance=new SiteFilter();
    private SiteFilter()
    {
        
    }
    public static SiteFilter getInstance()
    {
        return itsInstance;
    }
    public String filter( String site )
    {
        String prefix="http://",postfix="/";
        site = site.toLowerCase();
        int i,j;
        i = site.indexOf( prefix );
        if( i==-1 )
        {
            i = 0;
            j = site.indexOf( postfix );
        }else
        {
            i += prefix.length();
            j = site.indexOf( postfix, i+1 );
        }
        if( i!=-1 && j!=-1 && i<=j )
            site = site.substring( i, j );
        
        return site;
    }
}

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?