计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97%以上,未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系统得到了专家的好评,并有多篇论文在国内外发表。 计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll和相应的概率词典,开发者可以完全忽略汉语词法分析,直接在自己的系统中调用ICTCLAS,ICTCLAS可以根据需要输出多个高概率的结果,输出格式也可以定制,开发者在分词和词性标注的基础上继续上层开发。
上传时间: 2014-01-02
上传用户:15736969615
广东幸运七星彩票分析系统 (ADO+SQL),Delphi写的
上传时间: 2013-12-27
上传用户:yuanyuan123
银行代收电话费管理系统功能叙述 1、使用文件管理整个收费信息,内容有: 客户姓名C16,电话号码N11,市话费F7.2,长途费F7.2,信息费F7.2,ADSL费F7.2,费用合计F8.2,对应年月N6,收费状态C(0――未收,1――已收),收费日期D,银行帐号N20,收费人编姓名 2、提供的功能:(注:所有输出送显示器) A按月统计总的收费情况; B收费、退费的处理及相应单据的输出; C提供按姓名和电话号码查询收费状况及费用明细,要求对姓名按顺序插入排序(稳定排序),对电话号码按折半插入排序。
上传时间: 2015-05-10
上传用户:zhouli
汇编格式的CIH病毒的源码分析文件,包括1.1-1.4版本,通过对此病毒的分析,可以对WINDOWS系统有更深入的了解
上传时间: 2013-12-11
上传用户:firstbyte
Chipcon CC2420 reference design w/PA board rev B CC2420_w_PA_PCB.ZIP FABRICATION.PHO - fabrication drawing COPPER1.PHO - copper layer #1 (top side) COPPER2.PHO - copper layer #2 (inner ground plane) COPPER3.PHO - copper layer #3 (inner power plane) COPPER4.PHO - copper layer #4 (bottom side) TOPMASK.PHO - top side solder mask BOTTOMMASK.PHO - bottom side solder mask NCDRILL.DRL - drill data file NCDRILL.LST - drill list NCDRILL.REP - drill report
标签: 2420 FABRICATION reference fabricati
上传时间: 2015-05-12
上传用户:xc216
这是移动公司网络分析系统项目招标文件,文件涉及移动网络性能监控需求,客户行为分析等
上传时间: 2015-05-12
上传用户:zhengjian
对于学习c语言嵌入式linux系统的汇编伪指令的应用,
上传时间: 2014-01-01
上传用户:tianyi223
图书馆管理系统,3阶b树 数据结构实验,简单易懂 初学者的作品
上传时间: 2014-01-09
上传用户:gaojiao1999
CMXBTree 的主要作用是在内存中建立一棵B+树,主要针对数据量较大,查询频繁的数据。总之,CMXBTree 可被视作一个在内存中的数据库使用。其特点是:短小精悍。
上传时间: 2015-05-15
上传用户:ynwbosss
将链表B中的内容插入链表A中,并保持顺序不变
标签:
上传时间: 2015-05-16
上传用户:txfyddz