实现中文信息处理中的汉语分词的功能,采用了正向最大和逆向最大的分词算法。
标签: 信息处理 汉语 分
上传时间: 2014-12-01
上传用户:ljt101007
一个java的分词程序,希望对大家有用,分词的效率还可以
标签: java 分 程序
上传时间: 2016-07-20
上传用户:anng
一个用于搜索分词的项目,已经内置了10万的词汇量
标签: 搜索 分 项目
上传时间: 2016-07-24
上传用户:yuchunhai1990
采用的是一种用最小切分和逆向最大匹配法结合的一种复合分词算法,目前对岐义识别还处于初步研究阶段.
标签: 分 匹配法 算法
上传时间: 2016-07-28
上传用户:qwe1234
开源项目BOGOFILTER的源码.该项目实现BAYES文本分类算法,不过该源码只支持英文的分词
标签: BOGOFILTER BAYES 项目 源码
上传时间: 2014-07-23
上传用户:dancnc
paoding的中文分词程序,效果还可以.这个可以作为一些基本应用的分词.
标签: paoding 分 程序
上传时间: 2014-01-17
上传用户:894898248
Classifier4J是一个很好的基于java的分类器,里面有Native bayes和KNN等方法的文本分类.另外还 提供了分词和自动摘要等功能
标签: Classifier4J Native bayes java
上传时间: 2016-08-14
上传用户:lwwhust
中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。
标签: ICTCLAS 分 识别 汉语
上传时间: 2014-01-20
上传用户:水口鸿胜电器
基于词库的中文分词组件,可以直接用于Lucene的索引建立。以及中文搜索。
标签: 分
上传时间: 2016-08-22
上传用户:llandlu
又一个中文分词组件,作者自称很牛,企业级的,字库很多。也可直接用于lucene索引和搜索。
上传时间: 2013-12-30
上传用户:cazjing