⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 82.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: daniel (飞翔鸟), 信区: DataMining
标  题: Re: LSI(潜在语义索引)到底是什么?
发信站: 南京大学小百合站 (Sat Apr 12 13:00:34 2003)


【 在 Chipmunk (花栗鼠无语中) 的大作中提到: 】
: LSI是PCA(Primary Component Analysis)用在文本处理上,目的还是降维,

Principal Component Analysis


: 和向量空间模型、概率模型不是一个层次上的事物。
: 在IR里,可以先用LSI将query和document投影到低维空间,然后再计算它们
: 之间的距离(采用向量空间模型)。
: 使用LSI的潜在目的是将Co-occurring terms in the same document more often 
: than chance投影到同样的维上。
: (请大家指正!)
: 【 在 supermoon (supermoon) 的大作中提到: 】
: : 我看到有人说LSI是一种索引技术和倒排索引等一起并列;
: : 也有人说LSI是特征选择的一种方法,还有人说LSI是特征重构的方法,
: : 是特征选择的后一步工作;更有人说LSI是一种文本模型,和向量空间模型,
: : 概率模型并列。到底LSI是什么?我真的胡涂了,求教各位大侠了。


--
宠辱不惊  闲看庭前花开花落
去留无意  漫随天外云卷云舒

※ 修改:.daniel 于 Apr 12 13:01:09 修改本文.[FROM: 159.226.47.55]
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 159.226.47.55]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -