⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 858.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: singhoo (tony), 信区: DataMining
标  题: 各位大虾,进来讨论一下!
发信站: 南京大学小百合站 (Mon Sep  9 23:53:01 2002), 站内信件

我准备做web文本分类方面的研究(硕士),看了2个月论文,本来打算做个
原形系统,实现别人的算法,但是偶实验室一老师从美国回来,说别人都有
现成的系统,这样做没有意义!要做一些算法改进和创新
搞的我现在很慌张,只好重做打算

1:根据目前我的理解,做www文本分类,在机器学习(分类)算法上很难有突破
无论是naive bayes,KNN还是SVM都比较成熟,我目前也没有能力去做这个
算法的改进,所以想在特征提取算法/层次分类/使用超连接上做点研究,

2:另外,我打算建立自己的数据集(中文新闻web),目前国内好像没有公开的
web训练集,这样应该有点意义吧,不过国外的论文一般都使用几个常用的数据
集,我这样的数据集能被承认吗?

3:做算法研究,而且时间有限,我不想花时间编程实现分类器(NB,KNN,SVM等)
有源代码可用吗?我研究了rainbow系统,但是它集成了文档统计模型,特征
提取,而且不能处理中文,很难用.大家做算法研究有什么经验和好的方式?
在对文档建模(编程实现)后,得到词,词频,文档频等数据后,可以matlab仿真吗?


希望大家讨论一下,给点建设性意见!THX

--
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 202.38.240.195]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -