一个用于搜索分词的项目
一个用于搜索分词的项目,已经内置了10万的词汇量...
一个用于搜索分词的项目,已经内置了10万的词汇量...
采用的是一种用最小切分和逆向最大匹配法结合的一种复合分词算法,目前对岐义识别还处于初步研究阶段....
开源项目BOGOFILTER的源码.该项目实现BAYES文本分类算法,不过该源码只支持英文的分词...
paoding的中文分词程序,效果还可以.这个可以作为一些基本应用的分词....
Classifier4J是一个很好的基于java的分类器,里面有Native bayes和KNN等方法的文本分类.另外还 提供了分词和自动摘要等功能...