📄 12.txt
字号:
发信人: WbAI (wbAI), 信区: DataMining
标 题: 路透社的数据集的使用帮助(三)
发信站: 南京大学小百合站 (Sat Oct 12 20:42:48 2002)
有了上面的解释,就好办了(其实该数据集中还有很多字段,但都不影响我下面的描述,
故不再说明那些字段了)
对于一个分类任务:
首先找到训练例,如果你想与LEWIS的实验结果进行比较,即找LEWISSPLIT为“TRAININ
G”的所有文章做为训练例集。如果想与HAYES的实验结果进行比较,即找CGISPLIT为“TR
AINING-SET”的所有文章作为训练例集。对于测试例的选取就不用我说了吧?
至于分类类别,在(二)中提取的<Topic>ClassName</Topic> 指明了哟。
具体细节的东西,我想做文本分类的大虾比我懂:)
再见。
--
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 202.112.78.52]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -