12.txt

来自「This complete matlab for neural network」· 文本 代码 · 共 21 行

TXT
21
字号
发信人: WbAI (wbAI), 信区: DataMining
标  题: 路透社的数据集的使用帮助(三)
发信站: 南京大学小百合站 (Sat Oct 12 20:42:48 2002)


有了上面的解释,就好办了(其实该数据集中还有很多字段,但都不影响我下面的描述,
故不再说明那些字段了)


对于一个分类任务:

  首先找到训练例,如果你想与LEWIS的实验结果进行比较,即找LEWISSPLIT为“TRAININ
G”的所有文章做为训练例集。如果想与HAYES的实验结果进行比较,即找CGISPLIT为“TR
AINING-SET”的所有文章作为训练例集。对于测试例的选取就不用我说了吧?


  至于分类类别,在(二)中提取的<Topic>ClassName</Topic> 指明了哟。


  具体细节的东西,我想做文本分类的大虾比我懂:)

  再见。
--

※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.112.78.52]

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?