一个用于搜索分词的项目
一个用于搜索分词的项目,已经内置了10万的词汇量...
一个用于搜索分词的项目,已经内置了10万的词汇量...
采用的是一种用最小切分和逆向最大匹配法结合的一种复合分词算法,目前对岐义识别还处于初步研究阶段....
开源项目BOGOFILTER的源码.该项目实现BAYES文本分类算法,不过该源码只支持英文的分词...
paoding的中文分词程序,效果还可以.这个可以作为一些基本应用的分词....
Classifier4J是一个很好的基于java的分类器,里面有Native bayes和KNN等方法的文本分类.另外还 提供了分词和自动摘要等功能...
中科院的汉语词法分析系统ICTCLAS,主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。...
基于词库的中文分词组件,可以直接用于Lucene的索引建立。以及中文搜索。...
又一个中文分词组件,作者自称很牛,企业级的,字库很多。也可直接用于lucene索引和搜索。...
一个简单有效的中文分词算法,包含正向最大匹配算法,java实现。...
这是分词系统的词库,希望能对做分词的朋友有所帮助。...