⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 splitword.java~122~

📁 java制作的中文分词DLL文件
💻 JAVA~122~
字号:
package com.xjt.nlp.word;

/**
 * <p>Title: Java中文分词组件</p>
 * <p>Description: 本组件以中科院ICTCLAS系统为基础,在其基础之上改编,本组件仅供学习和研究用途,任何商业用途将自行承担法律后果,与组件编写人无关。</p>
 * <p>Copyright: Copyright (c) 2004</p>
 * <p>Company: 北京师范大学</p>
 * @author 陈天
 * @version 1.0
 */
import java.util.LinkedList;
import java.util.List;

public class SplitWord {
    public SplitWord() {
    }
    /**
     * 在ICTCLAS的基础上做进一步的分词。
     * @param sentence 输入句子
     * @return 一个LinkedList链表,每一个项是一个Word对象
     */
    public static List splitWord(String str) {
        Sentence sen = new Sentence();
        ICTCLAS ict = ICTCLAS.getInstance();
        String str = ict.paragraphProcess(sentence.trim());
        String[] allWords = str.split(" ");
        for (int i = 0; i < allWords.length; i++) {
            int pos = allWords[i].lastIndexOf("/");
            if (pos > 0) {
                Word word = new Word(allWords[i].substring(0, pos),allWords[i].substring(pos + 1));
                sen.add(word);
            }
        }
        return list;
    }

    public static void main(String[] args) {
        List all = SplitWord.splitWord("巴拿马和美国都是国家地区,汉族是一个民族。/");
        for (int i=0;i<all.size();i++){
            Word word = (Word) all.get(i);
            System.out.print(word.getWord());
            System.out.println(" /"+word.getAttribute());
        }
    }

}

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -