📄 log.txt
字号:
词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97%以上,未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系统得到了专家的好评,并有多篇论文在国内外发表。
词\是\最\小\的\能\够\独\立\活\动\的\有\意\义\的\语\言\成\分\。\ 但\汉\语\是\以\字\为\基\本\的\书\写\单\位\,\词\语\之\间\没\有\明\显\的\区\分\标\记\,\因\此\,\中\文\词\语\分\析\是\中\文\信\息\处\理\的\基\础\与\关\键\。\为\此\,\我\们\中\国\科\学\院\计\算\技\术\研\究\所\在\多\年\研\究\基\础\上\,\耗\时\一\年\研\制\出\了\汉\语\词\法\分\析\系\统\ICTCLAS\(\Institute\ of\ Computing\ Technology\,\ Chinese\ Lexical\ Analysis\ System\)\,\该\系\统\的\功\能\有\:\中\文\分\词\;\词\性\标\注\;\未\登\录\词\识\别\。\分\词\正\确\率\高\达\97%\以\上\,\未\登\录\词\识\别\召\回\率\均\高\于\90%\,\其\中中\国\人\名\的\识\别\召\回\率\接\近\98%\处\理\速\度\为\31\.\5Kbytes/s\。\ICTCLAS\的\特\色\还\在\于\:\可\以\根\据\需\要\输\出\多\个\高\概\率\结\果\,\有\多\种\输\出\格\式\,\支\持\北\大\词\性\标\注\集\,\973\专\家\组\给\出\的\词\性\标\注\集\合\。\该\系\统\得\到\了\专\家\的\好\评\,\并\有\多\篇\论\文\在\国\内\外\发\表\。\
我们学校是一座美丽的校园。
我\们\学\校\是\一\座\美\丽\的\校\园\。\
我们学校是座美丽的校园。
我们\学校\是\座\美丽\的\校园\。\末##末\
我们学校是座美丽的校园。
我们\学校\是\座\美丽\的\校园\。\末##末\
我们学校是座美丽的校园。
我们\学校\是\座\美丽\的\校园\。\末##末\
我们学校是座美丽的校园。
我们\学校\是\座\美丽\的\校园\。\末##末\
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -