搜索结果

找到约 290 项符合 分词 的查询结果

技术资料 ROST CM 说明

ROST CM 是从网页、搜索引擎、论坛、读者评论、即时通讯聊天群中采集和导入各种信息,对信息进行分词,抽取语义要素,然后进行聚类、分类、相关性、相似性、情感倾向等分析,构建出关系网络、社会网络、语义网络等,并能将结果导出到SPSS、MatLab、NETDraW等软件进一步分析。 ...
https://www.eeworm.com/dl/859071.html
下载: 6
查看: 7183

技术资料 一种无词典快速抽词算法的设计和实现

中文抽词在中文自然语言处理中是最基础的工作。本文提出了一种无词典的t-score 和二分相结合的抽词算法。它首先对原始文本进行预处理,利用噪音词的辅助信息来做初始切分,经过处理后一部分词被抽取出来,存
https://www.eeworm.com/dl/917182.html
下载: 6
查看: 2549

多国语言处理 svm(支持向量机)分类算法本质上是二类分类器

svm(支持向量机)分类算法本质上是二类分类器,实现多类分类的方法一般是将多类分类看作是多个一对多的二类分类器。本程序就是基于svmlight的svm多类分类器实现。对分类感兴趣的用户请参照。配合中文分词(参见我上传的程序),可实现中文多类分本分类。 ...
https://www.eeworm.com/dl/637/274071.html
下载: 38
查看: 1152

多国语言处理 计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位

计算所汉语词法分析系统ICTCLAS介绍 词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。为此,我们中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了汉语词法分析系统ICTCLAS(Institute of Computing Tech ...
https://www.eeworm.com/dl/637/150427.html
下载: 38
查看: 1140

Java编程 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能

一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类( ...
https://www.eeworm.com/dl/633/382446.html
下载: 71
查看: 1197

多国语言处理 1. 先打开规则库

1. 先打开规则库,读入规则集 (可比较两个规则文件rule1.txt 和 rule2.txt的差异) 2. 选择经过分词和词性标注的文件,进行句法分析 3. 分析结果文件与测试文件在同一个目录下,文件后缀名为 .pcfg 4. 分析结束后,同时产生一个新的规则文件,后缀名为.new, 可以观察规则概率值和期望次数的变化 5. 分析结果逐个以树形图方 ...
https://www.eeworm.com/dl/637/240556.html
下载: 141
查看: 1109

人工智能/神经网络 整个实验是在Windows环境下使用delphi完成的。选取了600篇文档

整个实验是在Windows环境下使用delphi完成的。选取了600篇文档,数据集共分教育,商业与经济,计算机与因特网,娱乐与休闲,自然科学5个类别, 教育类包括31篇文档, 商业与经济类有93篇文档, 计算机与因特网102篇文档, 娱乐与休闲166篇文档, 自然科学有208篇文档。 目录“DataSet”:RawText中的文本分词后保存在Data ...
https://www.eeworm.com/dl/650/290926.html
下载: 122
查看: 1073

多国语言处理 整个实验是在Windows环境下使用delphi完成的。选取了600篇文档

整个实验是在Windows环境下使用delphi完成的。选取了600篇文档,数据集共分教育,商业与经济,计算机与因特网,娱乐与休闲,自然科学5个类别, 教育类包括31篇文档, 商业与经济类有93篇文档, 计算机与因特网102篇文档, 娱乐与休闲166篇文档, 自然科学有208篇文档。 目录“DataSet”:RawText中的文本分词后保存在Data ...
https://www.eeworm.com/dl/637/309569.html
下载: 28
查看: 1079

技术资料 ROSTCM使用说明(老版)

ROST Content Mining软件简称ROST CM软件,即内容挖掘分析软件。它是由武汉大学沈阳教授及其团队研发的,专门用来进行文本内容处理的一-款软件。ROSTCM软件具有分词处理、高频词提取、情感分析、语义网络分析、流量分析、可视化分析等一系列功能,一经推出便受到社会和学界的广泛关注。截至目前已有众多学者 ...
https://www.eeworm.com/dl/748011.html
下载: 14
查看: 6781

技术资料 rostcm6.0词频分析软件

ROST cm是一款免费的大型内容分析研究性工具平台,主要功能包括:辅助各学科进行研究,协助完成文本分析和内容分析方面的研究,凡是需要分析论文、微博、博客、论坛、网页、书籍、聊天记录、电子邮件、本地文本类格式文件、数据库中各类文本字段的学科,都可以使用本软件,分析方法目前支持:分词、字频统计、词频统计、聚 ...
https://www.eeworm.com/dl/858162.html
下载: 11
查看: 3802