基于超链接和内容相关度的综合爬行策略 - 免费下载
技术资料资源
文件大小:339 K
💡 温馨提示:本资源由用户 joshau007 上传分享,仅供学习交流使用。如有侵权,请联系我们删除。
介绍了网页分析算法HITS 算法,并对HITS 算法进行改进,提出了一种基于超链接和内容相关度的网页排序算法VHITS 算法。VHITS 算法引入向量空间模型计算网页内容的主题相关度,并用来评价