中文自动分类。使用spider抓取网络信息
中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。...
中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。...
该源码用c++编写,实现了中文分词的功能。...
汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其...
汉化CLucene今天,把CLucene的程序改了一下,可以支持汉字了·1·在vc6编译2·还不支持分词,但支持汉字,...
关于中文中词语搭配的三篇论文,利用语义间的信息消解分词中的歧义问题,希望能给研究分词消歧的人一些帮助,谢谢!...