使用IBM SPSS Statistics進行數(shù)據(jù)驗證!

2023-04-21 11:21:42 來源:軟服之家

隨機計算能力的提高,對數(shù)據(jù)信息的需求也不斷增長,同時收集數(shù)據(jù)越來越多,這就導(dǎo)致出現(xiàn)更多的數(shù)據(jù)輸入錯誤。如果使用這些錯誤數(shù)據(jù)用于SPSS軟件的預(yù)測模型來獲取預(yù)測結(jié)果,會導(dǎo)致預(yù)測結(jié)果出現(xiàn)較大偏差,因此用于預(yù)測的數(shù)據(jù)需要保持干凈。如果使用傳統(tǒng)方法手動對預(yù)測數(shù)據(jù)進行驗證,龐大的數(shù)據(jù)已經(jīng)超人力所能處理的能力,SPSS軟件就能實現(xiàn)自動化的數(shù)據(jù)驗證,極大節(jié)省了人力物力。

一、驗證規(guī)則

數(shù)據(jù)驗證規(guī)則作用是確定個案是否有效,SPSS軟件中有兩種類型的驗證規(guī)則:單變量規(guī)則、交叉變量規(guī)則。驗證規(guī)則保存在數(shù)據(jù)文件的數(shù)據(jù)字典中,可以達到一次規(guī)則多次復(fù)用的效果。


(資料圖片)

1、單變量規(guī)則的名稱必須是唯一的,適用于數(shù)值、字符串和日期變量類型,是用戶自定義的規(guī)則,但是僅用于單個變量。

2、交叉變量規(guī)則是用戶自定義的規(guī)則,不僅可以用于單個變量,而且還可用于組合變量。

載入預(yù)定義規(guī)則是通過從安裝中所包括的外部數(shù)據(jù)文件載入預(yù)定義規(guī)則,這樣可以達到快速獲取一組可供使用的驗證規(guī)則。

二、數(shù)據(jù)驗證

數(shù)據(jù)驗證是指對活動那個數(shù)據(jù)集中存在可疑的和無效的個案、變量以及數(shù)據(jù)值進行驗證。點擊SPSS頂部菜單欄“數(shù)據(jù)”-“驗證”-“驗證數(shù)據(jù)”,即可打開驗證數(shù)據(jù)窗口。然后點擊頂部“基本檢查”菜單,該菜單包括三個模塊:分析變量、個案標(biāo)識。

1、分析變量。如果在“變量”菜單選擇了任何分析變量,則可選擇最大缺失值百分比、單個變量中個案所占的最大百分比、技術(shù)為1的類別的最大百分比、最小變異系數(shù)、最小標(biāo)準(zhǔn)差。

2、個案標(biāo)識。如果在“變量”菜單欄選擇了任何個案標(biāo)識變量,則可以選擇標(biāo)記不完整的標(biāo)識、標(biāo)記重復(fù)標(biāo)識。

點擊單變量規(guī)則菜單,可以自定義單變量規(guī)則、重新掃描。定義規(guī)則可以選擇所有變量、數(shù)值變量、字符串變量和日期變量設(shè)置規(guī)則。重新掃描用于更新新分布摘要。

點擊交叉變量規(guī)則,可以自定義邏輯表達式定義規(guī)則,表達式可以通過變量、函數(shù)和特殊變量、符號進行定義。

輸出是指輸出違反規(guī)則個案數(shù)據(jù)的報告。保存將違規(guī)的變量保存到活動數(shù)據(jù)集。

三、結(jié)果解析

通過數(shù)據(jù)驗證的設(shè)置,并且將演示數(shù)據(jù)集運行,得到如下結(jié)果。可以看到驗證數(shù)據(jù)包括標(biāo)識檢查、個案檢查。標(biāo)識檢查中包括不完整的標(biāo)識、重復(fù)的標(biāo)識。

四、小結(jié)

上面是給大家講解了利用SPSS軟件進行數(shù)據(jù)驗證,重點講解了數(shù)據(jù)驗證的基本檢查、單變量規(guī)則、交叉變量規(guī)則等。并且通過設(shè)置數(shù)據(jù)驗證參數(shù),展示了數(shù)據(jù)分析結(jié)果。

標(biāo)簽:

上一篇:
下一篇: