📄 41.txt
字号:
发信人: sdvictor (大家好), 信区: DataMining
标 题: Re: 北大网页分类竞赛
发信站: 南京大学小百合站 (Sun Mar 16 22:08:54 2003)
3月15号,计算机学会主办,北京大学承办的《全国搜索引擎和网上信息挖掘学术研讨会
》和《中文网页自动分类比赛》圆满结束,注册和出席这次会议的代表超过一百人,会
议进展比较顺利,大家交流的也很充分,我觉得还是满成功的。在15日下午的举行的分
类比赛中请了自然科学基金会的某位处长主持会议,采取现场捉取网页的方式,保证了
透明度和公证性,比赛中有包括清华、北大、上海交大等11家高校和科研机构参加,评
出了前三名,分别是清华大学电子系、清华大学计算机系、北京信息工程学院,由于国
内这类比赛较少,在长达2个半小时的现场抽取网页的过程中,100多位代表在会场中积极
参与,
显示了他们对本次比赛的兴趣之高。在会议闭幕式上,北京大学信息学院副院长李晓明
教授表示,希望这个会议可以长期办下去,并希望有兴趣的单位积极承办这个大会,希望
这个大会和比赛,能为国内信息检索和网页分类等各项科研提供一个实验数据和测试标准
,促进我国对中文网页处理技术的提高,抢占对中文网页处理的制高点,做出比google更
好的中文搜索引擎。
【 在 mining (key) 的大作中提到: 】
: 中文网页自动分类竞赛规则
: 1. 分类目录
: 本次中文网页分类竞赛使用的分类目录如表1所示,共11个类别。
: 表1 分类目录
: 类别编号 类别名称
: 01 人文与艺术
: 02 新闻与媒体
: 03 商业与经济
: 04 娱乐与休闲
: 05 政府与政治
: 06 社会与文化
: 07 教育
: 08 自然科学
: 09 社会科学
: 10 计算机与因特网
: 11 医疗与健康
: 2. 训练集和测试集
: a.训练集: 在现场比赛之前,参赛人员需要事先完成分类器的训练工作。分类器使用的
: 训练集,参赛人员可以有两种选择:
: 1) 参赛人员自己准备。按照表1的分类目录,参赛人员自己准备网页训练集。
: (以下引言省略 ... ...)
--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 166.111.68.53]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -