虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

语义分词

  • 编译器中词法分析部分

    编译器中词法分析部分,是基于正则表达式的词法分析,包括了代码,演示PPT,要分析的代码和分词结果

    标签: 编译器

    上传时间: 2013-12-30

    上传用户:13160677563

  • 停用词表

    停用词表,可以和词表结合用于分词,适用于任何开发环境。

    标签:

    上传时间: 2013-12-28

    上传用户:Yukiseop

  • 中文自动分类。使用spider抓取网络信息

    中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。

    标签: spider 自动 分类 网络信息

    上传时间: 2017-02-28

    上传用户:yyq123456789

  • 该源码用c++编写

    该源码用c++编写,实现了中文分词的功能。

    标签: 源码 编写

    上传时间: 2014-01-21

    上传用户:wang0123456789

  • 汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System)

    汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;词性标注;未登录词识别。分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。该系统得到了专家的好评,并有多篇论文在国内外发表。

    标签: Technology Computing Institute Analysis

    上传时间: 2013-12-24

    上传用户:ANRAN

  • 汉化CLucene今天

    汉化CLucene今天,把CLucene的程序改了一下,可以支持汉字了·1·在vc6编译2·还不支持分词,但支持汉字,

    标签: CLucene 汉化

    上传时间: 2014-11-26

    上传用户:qq21508895

  • 用java语言实现文本聚类

    用java语言实现文本聚类,包括聚类前的数据预处理:分词、降维、建立向量空间模型等

    标签: java 语言 文本聚类

    上传时间: 2014-11-18

    上传用户:zhoujunzhen

  • 自己下载一个语料库

    自己下载一个语料库,根据程序,计算权重,然后对语料库进行分词

    标签:

    上传时间: 2014-01-25

    上传用户:zhangliming420

  • CRF工具包

    CRF工具包,最新版,windows下使用,已编译好可直接使用。分词,特征选择,机器学习

    标签: CRF 工具包

    上传时间: 2017-07-23

    上传用户:zhengjian

  • 一个的文本分割程序

    一个的文本分割程序,采用了改变的最大长度切分结合统计分词方法。

    标签: 分割 程序

    上传时间: 2014-01-04

    上传用户:woshiayin