计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97%以上,未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系统得到了专家的好评,并有多篇论文在国内外发表。 计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll和相应的概率词典,开发者可以完全忽略汉语词法分析,直接在自己的系统中调用ICTCLAS,ICTCLAS可以根据需要输出多个高概率的结果,输出格式也可以定制,开发者在分词和词性标注的基础上继续上层开发。
上传时间: 2014-01-02
上传用户:15736969615
1) 系统采用面向对象的方法,严格按照SGIP1.2协议实现,支持Bind, BindResp,Submit, SubmitResp, Deliver, DeliverResp, Report, ReportResp, Unbind, UnbindResp消息,符合联通网关的最新标准(SGIP 0120修订版)。 2) 采用多线程并发处理的方式获取强大的性能,针对SGIP协议的特点,内建线程池进行消息的收发及处理操作,充分发挥系统和网络性能,再大的业务量也能够得到及时处理,丢包率小于0.01/%。
标签: 面向对象的
上传时间: 2015-05-09
上传用户:xiaohuanhuan
UNIX、Linux环境下,compress命令的C源代码有压缩率高和压缩快的特点
上传时间: 2015-05-17
上传用户:cazjing
信号处理中的谱分析,误码率较低,并绘出图形
上传时间: 2014-01-06
上传用户:星仔
本文介绍了QAM调制、解调和判决原理,讨论了QAM的误码率性能,并在SystemView下对QAM调制、解调系统进行了仿真,观察并分析了原始输入信号、调制信号、解调信号、星座图以及QAM信号的功率谱图。
上传时间: 2013-12-22
上传用户:chenxichenyue
用多点交叉实现遗传算法,能够自主选择种群大小、变异率、交叉率以及染色体编码的输出,结果输出为文本。
上传时间: 2013-12-17
上传用户:181992417
用分层实现遗传算法,高、低两个层次并行运行,自主选择种群规模、变异率及两层的交叉率,结果以文本方式输出。
上传时间: 2014-01-12
上传用户:yuanyuan123
站长!这是一个语音压缩编码的源程序,Speex是GNU软件,它基于CELP算法,压缩音频数据的比特率为从2kb/s到44kb/s 并具有许多不同于ITU给出的源程序的特征,详见:http://www.speex.org/。请查收! 站长!我已经上传5个源程序了,自问还是比较认真的!呵呵!因为我需要G723.1等语音压缩编码源程序,贵站有不少,所以请站长,批准我成为会员,我会继续努力上传有用的源程序的
上传时间: 2014-09-03
上传用户:gaojiao1999
信道是多径信道,升余弦滚降 ,取样时间无偏差的信道特性,与波形功率谱,与误码率仿真
上传时间: 2015-06-08
上传用户:tianjinfan
这是通信原理设计到的与量化编码有关的几种编码方法,包括A率十三码,简单的量化编码,以及波形成形
上传时间: 2013-12-24
上传用户:stella2015