计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97%以上,未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系统得到了专家的好评,并有多篇论文在国内外发表。 计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll和相应的概率词典,开发者可以完全忽略汉语词法分析,直接在自己的系统中调用ICTCLAS,ICTCLAS可以根据需要输出多个高概率的结果,输出格式也可以定制,开发者在分词和词性标注的基础上继续上层开发。
上传时间: 2014-01-02
上传用户:15736969615
用c++写的分词算法,简单,实用,详情看里面的帮助文件!
上传时间: 2015-05-14
上传用户:rishian
pat-tree中文抽词,中文字词搜寻演算法.
上传时间: 2013-12-06
上传用户:hakim
分词程序,Win32窗口界面程序,含设计文档,具有打开文档,显示分词结果,保存结果等功能,欢迎讨论。
上传时间: 2014-11-22
上传用户:hopy
本程序采用正向 逆向最大匹配才实现汉字分词
上传时间: 2014-01-19
上传用户:lindor
是一个很好的分词组件,里面有具体的说明文档。
标签: 分
上传时间: 2014-09-03
上传用户:金宜
这是我在作研究是所使用的分词系统软件,现在提交给大家,供大家研究使用.
上传时间: 2015-07-11
上传用户:lijinchuan
java 分词程序,有三个 我是一个学生, 不会特别多的
上传时间: 2013-12-19
上传用户:zhouchang199
海量分词研究版的java语言接口,并附dll动态链接库.
上传时间: 2013-11-26
上传用户:wsf950131
中科院的分词程序说明,缺少此文档的可以看看看。
上传时间: 2015-08-23
上传用户:wweqas