📄 81.txt
字号:
发信人: Chipmunk (花栗鼠无语中), 信区: DataMining
标 题: Re: LSI(潜在语义索引)到底是什么?
发信站: 南京大学小百合站 (Fri Apr 11 21:07:29 2003)
LSI是PCA(Primary Component Analysis)用在文本处理上,目的还是降维,
和向量空间模型、概率模型不是一个层次上的事物。
在IR里,可以先用LSI将query和document投影到低维空间,然后再计算它们
之间的距离(采用向量空间模型)。
使用LSI的潜在目的是将Co-occurring terms in the same document more often
than chance投影到同样的维上。
(请大家指正!)
【 在 supermoon (supermoon) 的大作中提到: 】
: 我看到有人说LSI是一种索引技术和倒排索引等一起并列;
: 也有人说LSI是特征选择的一种方法,还有人说LSI是特征重构的方法,
: 是特征选择的后一步工作;更有人说LSI是一种文本模型,和向量空间模型,
: 概率模型并列。到底LSI是什么?我真的胡涂了,求教各位大侠了。
--
有人说
欢乐总是很短
寂寞总是很长
让自己 在
欢乐的日子里欢乐
寂寞的日子里坚强
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 207.46.71.12]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -