虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

分词软件

  • 贝叶斯网络概率中文分词算法

    贝叶斯网络概率中文分词算法,基于概率的分词算法

    标签: 贝叶斯 网络 概率

    上传时间: 2017-09-26

    上传用户:manlian

  • 结巴分词包

    结巴中文分词包,使用Python进行编写的,比较好用  支持三种分词模式: - 精确模式,试图将句子最精确地切开,适合文本分析; - 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; - 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。

    标签: 中文分词

    上传时间: 2018-06-04

    上传用户:吓人的土豆

  • 论文查重软件(ROST+CM)下载+v6.0+免费版

    论文查重软件(ROST+CM)下载+v6.0+免费版,论文查重必备神器,中文分词、词频统计必备神器。

    标签: ROST CM v6 论文 下载 软件

    上传时间: 2017-03-18

    上传用户:cyy123123

  • 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位

    计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97%以上,未登录词识别召回率均高于90%,其中中国人名的识别召回率接近98%处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系统得到了专家的好评,并有多篇论文在国内外发表。 计算所汉语词法分析系统ICTCLAS同时还提供一套完整的动态连接库ICTCLAS.dll和相应的概率词典,开发者可以完全忽略汉语词法分析,直接在自己的系统中调用ICTCLAS,ICTCLAS可以根据需要输出多个高概率的结果,输出格式也可以定制,开发者在分词和词性标注的基础上继续上层开发。

    标签: ICTCLAS 汉语 计算

    上传时间: 2014-01-02

    上传用户:15736969615

  • 中文切词

    中文切词,非常优秀特此推荐。是目前分词效率较高的算法

    标签:

    上传时间: 2015-11-09

    上传用户:lx9076

  • 这是一个词库

    这是一个词库,对于那些做中文分词的人很有帮助的,是2000年的

    标签:

    上传时间: 2016-04-27

    上传用户:wl9454

  • 自己写的小分词程序

    自己写的小分词程序,中文分词测试版,仅供参考,谢谢!

    标签: 程序

    上传时间: 2013-12-04

    上传用户:2404

  • ROSTCM使用说明(老版)

    ROST Content Mining软件简称ROST CM软件,即内容挖掘分析软件。它是由武汉大学沈阳教授及其团队研发的,专门用来进行文本内容处理的一-款软件。ROSTCM软件具有分词处理、高频词提取、情感分析、语义网络分析、流量分析、可视化分析等一系列功能,一经推出便受到社会和学界的广泛关注。截至目前已有众多学者、科研人员和学生等群体纷纷使用这一分析工具展开了相应研究。

    标签: ROSTCM

    上传时间: 2021-12-26

    上传用户:

  • 这是我的中文信息处理的小作业

    这是我的中文信息处理的小作业,是一个自动分词系统。

    标签: 信息处理

    上传时间: 2015-02-17

    上传用户:zhuyibin

  • 这是一个中科院中文词法分析器

    这是一个中科院中文词法分析器,能对输入的文本进行分词,词性标注,未登陆词识别等功能,正确率相当高,很有用哦

    标签: 分析器

    上传时间: 2014-01-23

    上传用户:xiaoxiang