⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 1.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: mining (key), 信区: DataMining
标  题: 建议做文本分类的大虾使用同一个数据集
发信站: 南京大学小百合站 (Mon Sep 16 10:59:02 2002)

    目前,由于文本分类和挖掘缺乏统一的数据集,各种算法之间根本就不具有可比性。
而且,文本数据集的缺乏是困扰很多研究者的一个问题。

   我上载了reuter21578文本数据集在上载区。此数据集是reuters22173的升级版,国际
期刊上的一些论文集采用了这一数据集。

    这个数据集目前包含了21578篇短文,并对全部文档进行了标志,对大部分文档给定了
主题类,并提取了各种主题词,使用起来很为方便。细节大家可以看看它的readme文件。

    希望这个数据集能对做文本分类的同志有点帮助!


--

※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.118.237.39]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -