📄 899.txt
字号:
发信人: francois (断玉), 信区: DataMining
标 题: Re: 求文本分类语料
发信站: 南京大学小百合站 (Tue Nov 19 16:58:59 2002)
;)我没买过,你可以访问它们的网站查看信息:
http://trec.nist.gov/
另外如果你们学校报名参加TREC每年的tracks(包括一系列的信息检索任务,可以报名参
加其中的一项或几项,比如分类、检索、QA等),可以获取相应的语料光盘。
【 在 pxh1018 的大作中提到: 】
:
: 非常谢谢francois,请问怎样购买TREC的中文分类语料?
: 【 在 francois 的大作中提到: 】
: : 英文的公认分类语料库是reuters21578,一般评价分类系统都是基于此语料库
: : 中文的可以采用TREC的中文分类语料(新华社的1998年人民日报),但需要购买
: :
: : 可以参考“精华区- ○ 网络资源共享 - ○ DM测试数据 ”的如下帖子:
: :
: : 发信人: WbAI (wbAI), 信区: DataMining
: : 标 题: Re: 路透社的数据集如何使用?
: : 发信站: 南京大学小百合站 (Fri Oct 11 09:39:04 2002)
: :
: : 在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reut..
: : 78.html
: :
: : 另外,还有一个网址上有各种数据集:
: : http://kdd.ics.uci.edu/summary.data.type.html
: :
: : 进行文本分类,还有一个数据集是可以用的,即rainbow的数据集
: : http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html
: (以下引言省略...)
--
欢迎光临智能信息检索论坛
http://202.112.116.44
※ 来源:.南京大学小百合站 http://bbs.nju.edu.cn [FROM: 211.138.108.171]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -