13.txt

来自「This complete matlab for neural network」· 文本代码 · 共 17 行

TXT

17 行

发信人: mining (key), 信区: DataMining
标  题: 建议做文本分类的大虾使用同一个数据集
发信站: 南京大学小百合站 (Mon Sep 16 10:59:02 2002)

    目前，由于文本分类和挖掘缺乏统一的数据集，各种算法之间根本就不具有可比性。
而且，文本数据集的缺乏是困扰很多研究者的一个问题。

   我上载了reuter21578文本数据集在上载区。此数据集是reuters22173的升级版，国际
期刊上的一些论文集采用了这一数据集。

    这个数据集目前包含了21578篇短文，并对全部文档进行了标志，对大部分文档给定了
主题类，并提取了各种主题词，使用起来很为方便。细节大家可以看看它的readme文件。

    希望这个数据集能对做文本分类的同志有点帮助！


--

※ 来源:．南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.118.237.39]

13.txt - 源码说明

本页面展示了「This complete matlab for neural network」中的 13.txt 源码文件，采用文本编程语言编写，共 17 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与complete相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?