基于特征码的网页去重 - 免费下载
技术资料资源
文件大小:118 K
💡 温馨提示:本资源由用户 tqsun2008 上传分享,仅供学习交流使用。如有侵权,请联系我们删除。
网页去重处理是提高检索质量的有效途径,本文给出了一个基于特征码的网页去重算法,介绍了算法的具体实现步骤,采用二叉排序树实现。算法有较高的判断正确率,在信息检