虫虫首页| 资源下载| 资源专辑| 精品软件
登录| 注册

分词

  • 编译原理--词法分析器

    编译原理--词法分析器,实现读入一端程序,进行分词,并存入符号表中

    标签: 编译原理 分析器

    上传时间: 2016-08-16

    上传用户:caixiaoxu26

  • splitword

    splitword,分词,利用,snowball,第三方库

    标签: splitword

    上传时间: 2013-12-21

    上传用户:koulian

  • 自己用Markov模型做的一个整句物笔输入法的原型

    自己用Markov模型做的一个整句物笔输入法的原型,提供两种模式,普通模式和无空格分词的模式。可以从文章中学习。

    标签: Markov 模型 原型 输入法

    上传时间: 2014-09-10

    上传用户:星仔

  • C++一般的输入都不是作为宽字符集处理的

    C++一般的输入都不是作为宽字符集处理的,使用C++分词,如果能完成窄字符输入,但按宽字符取子串,基本上分词的问题就解决了

    标签: 输入 字符

    上传时间: 2013-12-11

    上传用户:源弋弋

  • XPDF:把pdf文档转化为TEXT文档的库

    XPDF:把pdf文档转化为TEXT文档的库,如需中文支持,请到官方网站下载中文语言包 HTM2TXT:把HTML文件转化为TEXT文件的库 ICTCLAS:对中文字符串进行分词的库 PS2TXT:把Postscript文件转化为TEXT文件的源码

    标签: XPDF TEXT 文档

    上传时间: 2014-09-03

    上传用户:龙飞艇

  • 刚上文机器翻译课

    刚上文机器翻译课,自己写的一个简单的正向最大匹配分词

    标签: 机器翻译

    上传时间: 2016-12-16

    上传用户:woshiayin

  • 使用最大正向匹配算法

    使用最大正向匹配算法,实现中文自动分词,对于初学者有很高的参考价值。

    标签: 匹配算法

    上传时间: 2014-01-05

    上传用户:cuibaigao

  • 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能

    一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character Language Modeling)、医学文献下载/解析/索引(MEDLINE Download, Parsing and Indexing)、数据库文本挖掘(Database Text Mining)、中文分词(Chinese Word Segmentation)、情感分析(Sentiment Analysis)、语言辨别(Language Identification)等API。

    标签: LingPipe Java 自然语言处理 开源

    上传时间: 2013-12-04

    上传用户:15071087253

  • 编译器中词法分析部分

    编译器中词法分析部分,是基于正则表达式的词法分析,包括了代码,演示PPT,要分析的代码和分词结果

    标签: 编译器

    上传时间: 2013-12-30

    上传用户:13160677563

  • 停用词表

    停用词表,可以和词表结合用于分词,适用于任何开发环境。

    标签:

    上传时间: 2013-12-28

    上传用户:Yukiseop