⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 duc2004htarticleparser.java

📁 dragontoolkit用于机器学习
💻 JAVA
字号:
package dragon.onlinedb.trec;import dragon.onlinedb.*;/** * <p>DUC 2004 HT article parser</p> * <p></p> * <p>Copyright: Copyright (c) 2005</p> * <p>Company: IST, Drexel University</p> * @author Davis Zhou * @version 1.0 */public class DUC2004HTArticleParser implements ArticleParser{    public String assemble(Article article){        return null;    }    public Article parse(String content){        BasicArticle article;        int start, end;        article=null;        try{            article=new BasicArticle();            //get PMID            start=content.indexOf("docid=");            if(start<0)                return null;            start=start+6;            end=content.indexOf(" ",start);            article.setKey(content.substring(start, end).trim());            //Body            start=content.indexOf(">",end+1);            start=start+1;            end=content.indexOf("(AFP)",start);            if(end>0){                start=end+5;                end=content.indexOf(" - ",start);                if(end<start+5)                    start=end+3;            }            article.setBody(content.substring(start));            return article;        }        catch(Exception e){            e.printStackTrace();            if(article.getKey()!=null)               return article;            else                return null;        }    }}

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -