📄 82.txt
字号:
发信人: daniel (飞翔鸟), 信区: DataMining
标 题: Re: LSI(潜在语义索引)到底是什么?
发信站: 南京大学小百合站 (Sat Apr 12 13:00:34 2003)
【 在 Chipmunk (花栗鼠无语中) 的大作中提到: 】
: LSI是PCA(Primary Component Analysis)用在文本处理上,目的还是降维,
Principal Component Analysis
: 和向量空间模型、概率模型不是一个层次上的事物。
: 在IR里,可以先用LSI将query和document投影到低维空间,然后再计算它们
: 之间的距离(采用向量空间模型)。
: 使用LSI的潜在目的是将Co-occurring terms in the same document more often
: than chance投影到同样的维上。
: (请大家指正!)
: 【 在 supermoon (supermoon) 的大作中提到: 】
: : 我看到有人说LSI是一种索引技术和倒排索引等一起并列;
: : 也有人说LSI是特征选择的一种方法,还有人说LSI是特征重构的方法,
: : 是特征选择的后一步工作;更有人说LSI是一种文本模型,和向量空间模型,
: : 概率模型并列。到底LSI是什么?我真的胡涂了,求教各位大侠了。
--
宠辱不惊 闲看庭前花开花落
去留无意 漫随天外云卷云舒
※ 修改:.daniel 于 Apr 12 13:01:09 修改本文.[FROM: 159.226.47.55]
※ 来源:.南京大学小百合站 bbs.nju.edu.cn.[FROM: 159.226.47.55]
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -