⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 18.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: GzLi (笑梨), 信区: DataMining
标  题: [合集]求文本分类语料
发信站: 南京大学小百合站 (Sat Nov 23 12:37:35 2002), 站内信件

pxh1018 (耐思) 于Tue Nov 19 11:06:36 2002)
提到:

请问谁有已经分好类的语料库!?

我的邮箱是:pxh@csru.edu.cn

francois (断玉) 于Tue Nov 19 13:21:44 2002)
提到:

英文的公认分类语料库是reuters21578,一般评价分类系统都是基于此语料库

中文的可以采用TREC的中文分类语料(新华社的1998年人民日报),但需要购买


可以参考“精华区- ○ 网络资源共享 - ○ DM测试数据 ”的如下帖子:


发信人: WbAI (wbAI), 信区: DataMining

标  题: Re: 路透社的数据集如何使用?

发信站: 南京大学小百合站 (Fri Oct 11 09:39:04 2002)


在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuters215
78.html


另外,还有一个网址上有各种数据集:

http://kdd.ics.uci.edu/summary.data.type.html


进行文本分类,还有一个数据集是可以用的,即rainbow的数据集

http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html


【 在 pxh1018 的大作中提到: 】

: 

: 请问谁有已经分好类的语料库!?

: 我的邮箱是:pxh@csru.edu.cn



pxh1018 (耐思) 于Tue Nov 19 16:08:11 2002)
提到:

非常谢谢francois,请问怎样购买TREC的中文分类语料?

【 在 francois 的大作中提到: 】

: 英文的公认分类语料库是reuters21578,一般评价分类系统都是基于此语料库

: 中文的可以采用TREC的中文分类语料(新华社的1998年人民日报),但需要购买

: 

: 可以参考“精华区- ○ 网络资源共享 - ○ DM测试数据 ”的如下帖子:

: 

: 发信人: WbAI (wbAI), 信区: DataMining

: 标  题: Re: 路透社的数据集如何使用?

: 发信站: 南京大学小百合站 (Fri Oct 11 09:39:04 2002)

: 

: 在下面的网址可以找到reuters数据集http://www.research.att.com/~lewis/reuter..
: 78.html

: 

: 另外,还有一个网址上有各种数据集:

: http://kdd.ics.uci.edu/summary.data.type.html

: 

: 进行文本分类,还有一个数据集是可以用的,即rainbow的数据集

: http://www-2.cs.cmu.edu/afs/cs/project/theo-11/www/naive-bayes.html

: 

: 【 在 pxh1018 的大作中提到: 】

: (以下引言省略...)



francois (断玉) 于Tue Nov 19 16:58:59 2002)
提到:

;)我没买过,你可以访问它们的网站查看信息:

http://trec.nist.gov/

另外如果你们学校报名参加TREC每年的tracks(包括一系列的信息检索任务,可以报名参
加其中的一项或几项,比如分类、检索、QA等),可以获取相应的语料光盘。


【 在 pxh1018 的大作中提到: 】

: 

: 非常谢谢francois,请问怎样购买TREC的中文分类语料?

: 【 在 francois 的大作中提到: 】

: (以下引言省略...)



⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -