SPSS ile veri analizi yaparken, üzerinde çalıştığımız verilerin normal ya da normale yakın dağılması gerekmektedir. Çünkü SPSS ile veriler üzerinde yapılacak bir çok istatistiksel analiz yöntemleri verilerin normal dağıldığı varsayımı üzerine kuruludur.
SPSS İle Veri Analizi – Normal Dağılım Testleri
Normal dağılıma sahip olmayan veriler üzerinde çalışmak, istatistiksel testlerin geçerliliğini ve analiz sonuçlarının güvenirliğini etkilemektedir. Eğer verileriniz normal dağılmıyorsa Non Parametrik analizler ile yolunuza devam etmelisiniz.
Peki SPSS’te normal dağılım testleri nasıl yapılır?
SPSS ile normal dağılım testleri iki farklı şekilde incelenmektedir.
- Grafik Testleri
- Analitik Testler
Grafik testleri ile normallik dağılımı testi için Q-Q grafiğine, eğilimden arındırılmış Q-Q grafiğine, Box Plot grafiğine, Stem And Leaf grafiğine ve histogram grafiğine bakacağız.
Analitik testler ile normallik dağılımı sınaması için Shapiro-Wilk testi, Kolmogorov–Smirnov testlerine bakacağız.
Örnek konu olarak reklam verdiğiniz mecraları 100 üzerinden puanladığınızı ve bu dağılımın normal dağılıp dağılmadığına baktığımızı varsayalım…
Veri setini SPSS üzerinde girdikten sonra;
Analyze>Descriptive Statistics>Explore kısmına tıklıyoruz.
Açılan pencerede “MecraPuanı” değişkenlerini Dependent List kısmına geçiriyoruz ve Plots seçeneğine tıklıyoruz.
Bu kısımdan grafik testleri de elde etmemiz için Stem-and-leaf, historgram ve normality plots with tests seçeneklerinin seçildiğinden emin oluyoruz.
Bu işlemleri tamamladıktan sonra normallik dağılımı test sonuçlarımızı yorumlamaya başlayabiliriz.
Tablodaki verilerde N=30 yani 30 farklı veri içeren bir veri seti olduğunu göstermektedir.
Tanımlayıcı istatistik kısmında normal dağılım testi için ortalama değeri (mean) ve median (medyan) değerinin birbirine yakın sonuçlar olması, veri setinin normal dağılıma sahip olduğunu göstermektedir. Görüldüğü gibi ortalama değerimiz 59,8 ve medyan değerimiz 65 olarak karşımıza çıktı. Bu verilere göre veri setimiz normal dağılıma yakın olduğunu düşünebiliriz.
Skewness (Çarpıklık) ve Kurtosis (Basıklık) değeri normal dağılım testi için bakılması gereken iki değer. Skewness ve Kurtosis değerlerinin normal dağılımı göstermesi için 0 ya da 0’a en yakın değerlere sahip olması gerekmektedir.
Burada normal dağılım için Z testi uygulamamız gerekiyor. Normal dağılım testinde Z testi nasıl uygulanır?
Z testi Skewness değerinin kendi Standart Error (Standart Sapma) değerine bölünmesi ile çıkan sonuca X dersek bu x değerinin;
-1,96<X>1,96 arasında olması gerekmektedir. Bu şartları karşıladığında veri setinin normal dağıldığını söyleyebiliriz. Bizim bu örneğimizde de ilgili değer – 1,96’dan küçük bir değer çıkmakta olup veri seti normal dağılıyor diyebiliriz.
Normallik testi için burada karşımıza Shapiro–Wilk testi ve Kolmogorov–Smirnov testleri çıkmaktadır. Hangisini kullanacağız derseniz, N değerinin 30 ve 30’dan büyük olması durumunda Kolmogorov-Smirnov testlerini kullanmamız gerekmektedir.
Kolmogorov-Smirnov test sonuçlarına göre elde edilen anlamlılık düzeyi 0,060’dır. SPSS bu testleri %95 güven aralığında yapmaktadır. Yani bizim değerimiz 0,05 anlamlılık düzeyinden büyük olduğu için verilerin normale yakın dağıldığını söyleyebiliriz.
Normal dağılım testi yaparken kullanacağımızı söylediğimiz grafik testlerinden olan histogram test sonuçlarında normal dağılım için ilgili kutucukların simetrik bir dağılıma (çan gibi) sahip olması gerekmektedir. Görüldüğü gibi simetrik bir dağılım pek söz konusu değil bu nedenle diğer grafiklere göz atmamız gerekiyor verilerin normal dağıldığını söyleyebilmek için.
Normal dağılım testi Stem-And-Leaf testi sonuçlarında ise sonlara doğru bir artış söz konusu olduğunu görüyoruz. Yine normal dağılım için ideal yapıyı görebildiğimizi söyleyemiyoruz. Bu nedenle grafik testlerin incelemesine devam etmemiz gerekiyor.
Normal dağılım testi Q-Q testi sonuçlarında ortadaki çizgiden çok fazla bir uzaklaşma söz konusu değil gördüğünüz gibi. Yani veri setinin normale yakın dağıldığı sonucuna bu grafik ile ulaşabilmekteyiz.
Normal dağılım testi Arındırılmış Q-Q testi sonuçlarında yine Q-Q testine benzer bir sonuç olduğu için yine veri seti normal dağılıyor denebilir. Arındırılmış Q-Q grafiğinde yukarıdaki Q-Q testinden farklı olarak rastgele dağılıma bakarak normal dağılım var mı yok mu onu kontrol ediyoruz. Burada yine son değerlere doğru bir yığılma var aslında ancak küçük bir veri seti olduğu için normale yakın bir dağılım söz konusu demekte olduğumuzu hatırlatmış olalım.
Normal dağılım testi Box Plot grafiğinde alttaki çizgi ile kutunun birleştiği yer minimum değer ile birinci çeyrek arasındaki uzaklığı temsil ederken, yukarıdaki çizgi ile kutunun üst kısmının birleştiği yer en büyük değer ile 3.çeyrek aralığındaki verilerin birbirine olan uzaklığını göstermektedir.
Kutunun içerisindeki kısım ise medyanın kutuyu ortalama derecesi arasındaki farkları göstermektedir.
Yukarıdaki verilerden hareketle son kısımda yine bir yığılma ve benzerlik olduğunu ancak kabul edilebilir bir normal dağılıma sahip olduğumuzu söyleyebiliriz.