⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 81.txt

📁 This complete matlab for neural network
💻 TXT
字号:
发信人: Chipmunk (花栗鼠无语中), 信区: DataMining
标  题: Re: LSI(潜在语义索引)到底是什么?
发信站: 南京大学小百合站 (Fri Apr 11 21:07:29 2003)


LSI是PCA(Primary Component Analysis)用在文本处理上,目的还是降维,
和向量空间模型、概率模型不是一个层次上的事物。

在IR里,可以先用LSI将query和document投影到低维空间,然后再计算它们
之间的距离(采用向量空间模型)。

使用LSI的潜在目的是将Co-occurring terms in the same document more often 
than chance投影到同样的维上。

(请大家指正!)


【 在 supermoon (supermoon) 的大作中提到: 】
: 我看到有人说LSI是一种索引技术和倒排索引等一起并列;
: 也有人说LSI是特征选择的一种方法,还有人说LSI是特征重构的方法,
: 是特征选择的后一步工作;更有人说LSI是一种文本模型,和向量空间模型,
: 概率模型并列。到底LSI是什么?我真的胡涂了,求教各位大侠了。


--
  有人说
         欢乐总是很短
         寂寞总是很长
  让自己 在
         欢乐的日子里欢乐
         寂寞的日子里坚强

※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 207.46.71.12]

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -