倒排
共 16 篇文章
倒排 相关的电子技术资料,包括技术文档、应用笔记、电路设计、代码示例等,共 16 篇文章,持续更新中。
hadoop倒排索引
适用于大数据文本处理项目,基于Hadoop框架实现高效的倒排索引构建与查询方案,支持分布式数据存储与并行计算,提升搜索效率和系统扩展性。
hadoop实现倒排索引
基于hadoop框架,用java编写实现倒排索引,
基于压缩倒排文件的中文全文检索仿真系统
探讨基于压缩倒排文件的中文全文检索技术,包括数据压缩方法、存储、检索与排名机制。借助中科院的高精度ICTCLAS中文分词系统,采用C++/STL语言仿真实现了一个中文全文检索系统。该文列出部分关键代码
基于压缩后缀数组技术的搜索引擎
目前,搜索引擎的核心模块(索引器)均采用倒排文件结构,对短语查询的准确率较低。该文引入后缀数组技术进行全文索引,为克服全文索引时占用空间大的缺点,研究了压缩后缀数组技术,把后缀数组索引的大小压缩到了O
基于构件的软件形式化开发方法研究与应用.rar
如何能快速高质量地开发出满足企业需求的信息系统软件,且使所开发的系统能够适应企业组织机构与业务流程的变化,具有良好的柔性已成为当今信息系统开发所面临的一个重要课题。 本文针对现有信息系统开发方法的不足,在对构件复用技术和XML技术深入研究的基础上,结合XML与构件技术这两种软件开发热门技术,并参考形式化开发方法,提出了基于构件的信息系统形式化开发方法模型。针对软件开发中需求分析不彻底,容易出现二义
以行为单位对行中以空格或标点符号为分隔的所有单词进行倒排
以行为单位对行中以空格或标点符号为分隔的所有单词进行倒排,同时去
除标点符号,之后把已处理的字符串(应不含标点符号)仍按行重新存入字符串数组xx中
1.matlab编程
1.matlab编程,实现函数的倒排序;
2.程序实现FFT,傅立叶逆变换;
3.一个图像处理程序,添加噪声,去噪。
首先对中文文档建立倒排文档
首先对中文文档建立倒排文档,然后根据建立的倒排文档,按照此检索算法对文档进行检索
对文件进行操作
对文件进行操作,对索引倒排表中的文件进行相应的操作
中文信息处理
中文信息处理,建立文件的倒排表,形成词频链表
首先对英文文档建立倒排文档
首先对英文文档建立倒排文档,然后根据建立的倒排文档,按照此检索算法对文档进行检索
整个实验是在Windows环境下使用delphi完成的。选取了600篇文档
整个实验是在Windows环境下使用delphi完成的。选取了600篇文档,数据集共分教育,商业与经济,计算机与因特网,娱乐与休闲,自然科学5个类别,
教育类包括31篇文档,
商业与经济类有93篇文档,
计算机与因特网102篇文档,
娱乐与休闲166篇文档,
自然科学有208篇文档。
目录“DataSet”:RawText中的文本分词后保存在DataSet目录。
数据表“Wo
向量空间模型算法
向量空间模型算法,给定一个经过分词的文档集,可以输出向量空间模型、特征词典、倒排索引表等功能,很经典的VSM算法源代码
整个实验是在Windows环境下使用delphi完成的。选取了600篇文档
整个实验是在Windows环境下使用delphi完成的。选取了600篇文档,数据集共分教育,商业与经济,计算机与因特网,娱乐与休闲,自然科学5个类别,
教育类包括31篇文档,
商业与经济类有93篇文档,
计算机与因特网102篇文档,
娱乐与休闲166篇文档,
自然科学有208篇文档。
目录“DataSet”:RawText中的文本分词后保存在DataSet目录。
数据表“Wo
1.基于luncene倒排索引格式的高性能索引数据访问接口。 2. 实现若干中文分词的的分词算法。
1.基于luncene倒排索引格式的高性能索引数据访问接口。
2. 实现若干中文分词的的分词算法。
本系统实现了分词和倒排索引
本系统实现了分词和倒排索引,分词采用正向最大匹配,