词库
共 64 篇文章
词库 相关的电子技术资料,包括技术文档、应用笔记、电路设计、代码示例等,共 64 篇文章,持续更新中。
分类词库
该词典收录了汉语和英文的各个领域的几十个大类如农业、法律、生物,几万个词汇,适合英语学习者。
Lucene.Net-2.9.4源码
Lucene.Net-2.9.4源码
Net最近居然升级了,到了2。9.4 后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把MMSeg给修改了一下支持了。
庖丁解羊中文分词器
<p>
官方说明:“刨丁解羊中文分词器,主要用于对网络蜘蛛或网络爬虫抓取的网页进行分词,支持繁体中文分词、简体中文分词、英文分词,是制作通用搜索引擎和垂直搜索引擎的核心组件。该软件在普通PC机器上测试显示:TXT格式正文分词速度约为3000万字/分钟,网页分词速度约为277.8个网页/秒。该软件采用基础词库(63万词语)+扩展词库(用户可手工添加新词)。DLL及OCX调用请联系QQ(601069
请认真阅读您的文件包然后写出其具体功能请认真阅读您的文件包然后写出其具体功能紫光地名词库
请认真阅读您的文件包然后写出其具体功能请认真阅读您的文件包然后写出其具体功能紫光地名词库
中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数!
中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数!
检测词库
检测词库,基于JAVA的LUCENE技术。广泛应用于检索系统领域。
问题重述:有一个内含有大约40万条常用词汇的词库。现给定一篇文章
问题重述:有一个内含有大约40万条常用词汇的词库。现给定一篇文章,使用这个词库分析出常用词汇的出现次数,并按出现次数由高到低排序这些词语。
改进算法的思路:
1. 通常一篇文章所包含的词语远少于词库中40万的数量;
2. 数据库建立索引之后,可采用“二分法”对词语进行快速定位;
3. 逐字缩小查询范围,如果查询到某个字符时范围已经为0,那么可以预测其后的词一定也不存在,(例如查询到fo
搜狗词库备份_2008_09_28
搜狗词库备份_2008_09_28
词库检索系统
词库检索系统,可以分析出任意文件夹下面的所有文件,以及查找某个特定的词语一否包含在某个文件里面
Java中lucene分词需要的ICTCLAS.dll文件和data词库
Java中lucene分词需要的ICTCLAS.dll文件和data词库
这是分词系统的词库
这是分词系统的词库,希望能对做分词的朋友有所帮助。
基于词库的中文分词组件
基于词库的中文分词组件,可以直接用于Lucene的索引建立。以及中文搜索。
基于正向最大匹配法的分词。采用hash表技术将一段连续的话用所给词库进行分词输出。
基于正向最大匹配法的分词。采用hash表技术将一段连续的话用所给词库进行分词输出。
中文信息处理的分词词库
中文信息处理的分词词库,百度分词词库,用于中文信息处理的词库分析和源程序链接
CT工作站具有打印报告、病历管理、图像处理专家词库等功能
CT工作站具有打印报告、病历管理、图像处理专家词库等功能
这是一个词库
这是一个词库,对于那些做中文分词的人很有帮助的,是2000年的
一个用ODBC访问Access的实例
一个用ODBC访问Access的实例,做的是自定义的单词库,有添加,查找,删改的功能
将词库词与词表词进行统计
将词库词与词表词进行统计,得到两者相同的部分,再找到完全不同的部分
自己写的一段分词程序,有2部分 第一个是词库的, 第二个是概略的
自己写的一段分词程序,有2部分
第一个是词库的,
第二个是概略的
字典软件MDICT的词库文件
字典软件MDICT的词库文件,内容是C的库函数,方便大家查询.MDICT有PC和PPC版本,大家请自己去GOOGLE搜索