📄 24.txt
字号:
发信人: GzLi (笑梨), 信区: DataMining
标 题: [合集]当数据缺值时怎么办?
发信站: 南京大学小百合站 (Sat May 25 23:34:24 2002), 站内信件
jhdai (毕不了业) 于Thu May 23 17:41:35 2002提到:
希望各位讲解一下
或推荐资料
谢谢!
helloboy (hello) 于Thu May 23 18:40:04 2002提到:
有很多处理办法的。
可以填充值,例如取平均值,中值,均方差等。
也可以在算法时把这属性或纪录忽略不处理。
jimo (寂寞) 于Thu May 23 19:10:16 2002提到:
数据的预处理的事情了
zrs (tita) 于Thu May 23 19:43:35 2002)
提到:
很多情况下的处理是不同的
edog (过海仙人) 于Sat May 25 18:30:14 2002)
提到:
对于空缺的属性值,最简单的办法是忽略该元组,也可以采用全局常量或属性的平均值填
充。此处推荐采用聚类和统计分析中的回归预测相结合的方法。首先使用聚类技术根据不
缺值的属性进行聚类,使类中元组保持最大的共性,类间元组保持最大的异性。然后利用
所在类其他元组在空缺值属性上的值构造一个回归模型来预测该属性的空缺值。根据问题
的复杂度,可选择采用线性回归或多元回归。相对于使用全局常量或属性的平均值而言,
采用这种技术预测出来的属性值能够更接近真实值。
//其余方法参见han的书。
⌨️ 快捷键说明
复制代码
Ctrl + C
搜索代码
Ctrl + F
全屏模式
F11
切换主题
Ctrl + Shift + D
显示快捷键
?
增大字号
Ctrl + =
减小字号
Ctrl + -