870.txt

来自「This complete matlab for neural network」· 文本代码 · 共 24 行

TXT

24 行

发信人: sinokdd (KDD in China), 信区: DataMining
标  题: Re: 各位大虾,进来讨论一下!
发信站: 南京大学小百合站 (Tue Sep 10 12:48:31 2002)


【 在 chdq135 的大作中提到: 】

: 尽管在国外已经做了不少，但是中文方面还是不够。

: 如果作中文呢？中文发展情况怎样？

: 就我所致，也是用字、词结合的方法（统计），结合元数据，一起来提高

: 分类性能。

: 请大侠点评点评！


仅供参考

我觉得单纯提取基于字词的特征，和现在通用的英文的WWW文本分类区别

不大，我认为如果你能够根据汉语的一些特点提取出一些英文没有

的特征，也许会对分类有帮助，比如汉语不同的语气。我的建议是你可以

看看汉语语言学方面的文章，看看他们的研究结果能否被你所用。


建立一个中文的新闻分类数据集是个好事，但我觉得新闻更像纯文本，因为

其中的连接并不多，这好像少了一些WWW的味道。
--

※ 来源:．南京大学小百合站 http://bbs.nju.edu.cn [FROM: 142.59.166.114]

870.txt - 源码说明

本页面展示了「This complete matlab for neural network」中的 870.txt 源码文件，采用文本编程语言编写，共 24 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫下载站收录了大量与complete相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?