语料

共 43 篇文章
语料 相关的电子技术资料,包括技术文档、应用笔记、电路设计、代码示例等,共 43 篇文章,持续更新中。

政务信息

政务信息,用于语料库使用设计等等,从而扩大语料处理软件的功能。

期刊论文:一种改进后的递增式语音语料抽选算法

·期刊论文:一种改进后的递增式语音语料抽选算法

基于三音子模型的语料自动选择算法

·基于三音子模型的语料自动选择算法

期刊论文:基于综合因素的汉语连续语音库语料自动选取

·期刊论文:基于综合因素的汉语连续语音库语料自动选取

基于Self-training和Web的术语翻译系统

现有基于模式的术语翻译系统存在2个主要缺点,即学习过程依赖人工标定语料和缺乏对模式的评分以及对候选术语的评分太简单。该文将self-training学习机制引入术语翻译系统,在一对训练语料上完成初始学

基于内容的垃圾短信过滤

研究一种基于最小风险贝叶斯决策的垃圾短信过滤方法。对于以文本信息为主的短信,采用信息增益的方法进行特征选择,使用基于最小风险贝叶斯决策方法进行分类。通过自建短信语料库对该方法进行了实验。实验结果表明,

中文文本体裁分类中特征选择的研究

针对文本体裁自动分类在特征选择和权重计算方面的特殊性,提出文本的内容类别信息,改进传统特征选择方法CHI以及权重计算公式tf.idf,并运用支持向量机在含5类体裁的语料上进行中文文本体裁自动分类。实验

基于支持向量机的英语名词短语指代消解

提出一种基于支持向量机(SVM)的英语名词短语的指代消解方法,并给出具体实现系统。实验采用了几个常用的基本特征,在MUC-6 公开语料上测试得到的F 值为68.6,优于同类型的其他原型系统。分析SVM

基于无向图序列标注模型的中文分词词性标注一体化系统

<p>摘 要:在中文词法分析中,分词是词性标注必须经历的阶段。为了能在分词阶段就充分利用词性标注的信息和减</p><p>少两阶段错误的累计,最好的方法是将两个阶段,整合到一个架构中。该文以无向图模型为基础,将分词和词性标</p><p>注有机地统一在一个序列标注模型中。由于可以采用更深层次的依赖关系作为特征,一体化系统在1998 年人民日</p><p>报语料上取得了97.19%的分词精确率和95.3

情感虚拟人技术在人机交互中的应用研究

<p>情感识别是机器通过识别和理解过程把人类的语音、表情和肢体语言中的情感信息识别出来。情感交互是机器通过接收人类的情感信息来模拟人类的情感决策过程,从而表达出自身情感的过程。本文的主要目标是把虚拟人技术应用到人机交互中,研究出具有情感识别功能和情感表达功能的机器。</p><p>本文的具体工作和贡献包括:</p><p>第一,详细描述虚拟人的三维模型和情感模型的建立过程。这里介绍了虚拟人实体的建立和

一款将AIML语料库转换为Verbot语料的软件

一款将AIML语料库转换为Verbot语料的软件,其中Verbot是国外非常流行的智能聊天软件。

用AIML语言开发的一款中文自动聊天软件

用AIML语言开发的一款中文自动聊天软件,附加有部分AIML中文对话语料库

NLP中viterby算法的实现,对语料进行处理

NLP中viterby算法的实现,对语料进行处理,建模,然后可以对新的语料进行句法标注

中文信息处理基础 第一讲VC环境编程简介 第二讲文件处理 第三讲字符编码 第四讲字频统计 第五讲文本断句 第六讲语料库

中文信息处理基础 第一讲VC环境编程简介 第二讲文件处理 第三讲字符编码 第四讲字频统计 第五讲文本断句 第六讲语料库

对北大语料进行地名前后次的抽取

对北大语料进行地名前后次的抽取,通过设置一个阈值,来控制选择。

该程序实现的是一个垃圾邮件过滤系统

该程序实现的是一个垃圾邮件过滤系统,方法采用的是NAIVE Bayes,语料库用的是LINspam—public,程序中有使用说明,希望大家一起探讨改进一下,

利用贝叶斯分类原理实现多义词的消歧。首先利用训练语料进行训练

利用贝叶斯分类原理实现多义词的消歧。首先利用训练语料进行训练,然后基于机器已经获取的知识的基础上对生语料进行词义标注。

一份很重要的语料库

一份很重要的语料库,为你的分词程序是一个很好用的资料库文件

对语料库的一些文献和资料集合

对语料库的一些文献和资料集合,有一定的参考价值

使用层叠隐马模型解决命名实体识别问题

使用层叠隐马模型解决命名实体识别问题,含有训练语料及测试预料。