文本聚类

文本聚类技术,作为自然语言处理与数据挖掘的关键组成部分,通过无监督学习方法自动将大量文档归类到不同的主题群组中。广泛应用于信息检索、情感分析、新闻分类等领域,是构建智能推荐系统和提高大数据处理效率的核心工具之一。掌握文本聚类算法对于电子工程师而言不仅是理解复杂信息系统架构的基础,也是开发高效内容管理...

资源总数
500

文本聚类 热门资料

查看全部 500 份 →

JAVA实现文本聚类,用到TF/IDF权重,用余弦夹角计算文本相似度,用k-means进行数据聚类等数学和统计 知识。

2017-02-25 36 文本聚类

类似于Weka的文本聚类工具箱,可以读取Weka格式的文件,并实现了常用的文本聚类算法以及聚类集成算法,对于机器学习的朋友来说是个好东西

2014-01-19 150 文本聚类