数据清洗
来源:华佗健康网
SPSS中的缺失值处理有专门的程序,在Analysis菜单下的Missing Data Analysis。可以提供缺失数据的详细信息和填补/删除缺失数据,填补的方法有EM和回归,删除的方法有列删和对删。
对于缺失情况的描述分析中有一个表“Data Pattern(all cases)”(要钩选Missing Value Analysis:Patterns中的All cases, optionally sorted by selected variable才能看到),其中列出了所有case在所有变量上的缺失情况。如果不采用列删和对删的方式处理缺失值,而是想自己手动根据这个表中的case num来删,就要注意了:如果使用Select Case后,这个表中的case num不同于数据文件(*.sav)中的case num,表中的case num是连续排列的,并不根据数据文件中的case num来的。
如果要填补缺失值,钩选EM(建议使用)或者regression后,还要点出Missing Data Analysis: EM这个对话框,将填补缺失值后的数据保留为文件或数据集,否则只会在output中出示缺失值分析的数据,而不会填补到原数据文件中。另外处于安全的考虑也要保留到新文件中,否则一旦保存就是不可逆的。
因篇幅问题不能全部显示,请点此查看更多更全内容