⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 pageparsermanager.java

📁 用来为垂直搜索引擎抓取数据的采集系统
💻 JAVA
字号:
/*
 * *****************************************************
 * Copyright (c) 2005 IIM Lab. All  Rights Reserved.
 * Created by xuehao at 2005-10-12
 * Contact: zxuehao@mail.ustc.edu.cn
 * *****************************************************
 */

package org.indigo.parser;

import java.util.ArrayList;

import org.apache.commons.httpclient.NameValuePair;
import org.indigo.xml.FiltPair;
/**
 * ItemParser的管理者,通过此类可以获得
 * 和设置一些ItemParser中的参数。
 * 因为在开始采集时是调用的此类,通过此类间接的
 * 生成ItemParser类。
 * 此类的方法都是直接调用ItemParser中的方法。
 * @author wbz
 *
 */
public class PageParserManager
{    
    protected int itsIndex;
    protected ArrayList itsPairs=null;

    private ItemParser itsItem=null;
    private boolean itsFilterFlag=true;
   // private String defaultValue=null;
    public PageParserManager( boolean f )
    {
        itsItem = new ItemParser();
        itsItem.setFilterFlag( f );
        itsIndex = 0;
        itsPairs = new ArrayList();
    }
    public void setDefaultValue(String name,String value)
    {
    	//defaultValue=value;
    	itsItem.setDefaultValue(name, value);
    }
    public void setIsByLogin(boolean IsByLogin)
    {
    	itsItem.setIsByLogin(IsByLogin);
    }
    public void setParser(Parser parser)
    {
    	
        itsItem.setParser( parser );
    }
    public void setIsByPost(boolean IsByPost)
    {
    	itsItem.setIsByPost(IsByPost);
    }
    public void setValuePair(NameValuePair data[])
    {
    	itsItem.setValuePair(data);
    }
    public void setCollectedFromUrl(String url)
    {
    	itsItem.setFromUrl(url);
    }
    public void setCollectedUrl(String url)
    {
        itsItem.setUrl( url );
    }

    public void setItsPageStr(String startStr, String endStr)
    {
    	itsItem.setItsPageStr(startStr, endStr);
    }
    public void removeField(String start, String end)
    {
        return;
    }
    public void removeAllFields()
    {
        itsPairs.clear();
        itsIndex = 0;
    }
    public void addField(String start, String end)
    {
        itsPairs.add( itsIndex++, new FiltPair(start,end) );
        itsItem.setPairList( itsPairs );
        return;
    }
    public void setPairList( ArrayList list )
    {
        itsPairs = list;
        itsItem.setPairList( list );
    }
    public String getAItem()
    {
        return itsItem.getAItem();
    }
    public void clearTable()
    {
    	itsItem.clearTable();
    }
    public int getErrorMark()
    {
    	return itsItem.getErrorMark();
    }
    public String getErrorField()
    {
    	return itsItem.getErrorField();
    }
    public boolean open()
    {
        return itsItem.open();
    }
    public void close()
    {
        itsItem.close();
    }
    
}

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -