Medyan İstatistik
Rehber

Normallik Testi Nasıl Yapılır? Shapiro-Wilk ve Çarpıklık-Basıklık

Parametrik testlerin önündeki ilk kontrol noktası normallik varsayımıdır. Bu rehberde hangi normallik testinin ne zaman kullanılacağını, çarpıklık-basıklık eşiklerini, testin hangi düzeyde (grup, fark, artık) yapılması gerektiğini ve varsayım sağlanmadığında izlenecek yolları R kodları ve jamovi menü yollarıyla adım adım açıklıyoruz.

Normallik varsayımı neden önemli?

Bağımsız örneklem t-testi, eşleştirilmiş t-testi, tek yönlü ve tekrarlı ölçümlü ANOVA ile Pearson korelasyonu gibi parametrik testler, verilerin (ya da modele göre fark puanlarının veya artıkların) normal dağıldığı varsayımına dayanır. Varsayım ciddi biçimde ihlal edildiğinde p değerleri ve güven aralıkları yanıltıcı olabilir: Tip I hata oranı nominal düzeyden sapar ve testin gücü düşer. Bu nedenle tez ve makalelerde parametrik test raporlamadan önce normallik kontrolünün nasıl yapıldığının açıkça belirtilmesi beklenir.

Kontrol tek bir sayıya indirgenmemelidir: iyi uygulama, test istatistiği (Shapiro-Wilk), betimsel katsayılar (çarpıklık-basıklık) ve grafiklerin (histogram, Q-Q) birlikte değerlendirilmesidir.

Hangi test ne zaman kullanılır?

Örneklem büyüklüğü Önerilen test Açıklama
n < 50 Shapiro-Wilk Küçük örneklemde standart tercih
n ≥ 50 Kolmogorov-Smirnov (Lilliefors düzeltmeli) Geleneksel eşik; SPSS 'Explore' çıktısındaki K-S budur

Önemli bir ek: Shapiro-Wilk testi yalnızca küçük örneklemlere özgü değildir; n ≤ 5000'e kadar geçerlidir ve simülasyon çalışmalarında Kolmogorov-Smirnov'a göre genellikle daha güçlü bulunmuştur (Razali & Wah, 2011). Bu nedenle çoğu durumda Shapiro-Wilk'i birincil test olarak raporlamak, K-S'yi ise gelenek gereği ek olarak sunmak savunulabilir bir stratejidir.

Çarpıklık-basıklık kaç olmalı?

Çarpıklık (skewness) dağılımın simetrisini, basıklık (kurtosis) kuyruk ağırlığını gösterir. Yaygın kabul gören eşikler şöyledir: ±1 aralığı ideal kabul edilir (George & Mallery, 2010); ±2 aralığı ise birçok kaynakta kabul edilebilir üst sınır olarak anılır. Tabachnick ve Fidell (2013) büyük örneklemlerde katsayıların standart hatalarının küçüldüğünü, bu yüzden mutlak değerlerin ve grafiklerin birlikte yorumlanması gerektiğini vurgular.

Alternatif bir yaklaşım z-skorudur: çarpıklık (veya basıklık) katsayısı kendi standart hatasına bölünür. Elde edilen z değeri, küçük örneklemlerde ±1.96, orta büyüklükte ±2.58 sınırıyla karşılaştırılır; büyük örneklemlerde ise bu yaklaşım aşırı duyarlı hale geldiği için önerilmez.

z_carpiklik = carpiklik / SH(carpiklik)    z_basiklik = basiklik / SH(basiklik)

Normallik nerede test edilir? (En sık yapılan hata)

En sık yapılan hata, normallik testini tüm örneklem üzerinde tek seferde çalıştırmaktır. Doğru düzey, kullanılacak analize göre değişir:

R ile normallik testi

Aşağıdaki kod bloğu, örnek bir veri üzerinde tüm normallik kontrollerini gösterir; kendi verinizde değişken adlarını değiştirmeniz yeterlidir.

# Ornek veri: iki gruplu bir calisma
set.seed(42)
veri <- data.frame(
  grup = rep(c("Deney", "Kontrol"), each = 30),
  skor = c(rnorm(30, 75, 10), rnorm(30, 70, 10))
)

# 1) Tek degisken icin Shapiro-Wilk
shapiro.test(veri$skor)

# 2) Grup bazinda Shapiro-Wilk (rstatix paketi)
library(dplyr)
library(rstatix)
veri %>%
  group_by(grup) %>%
  shapiro_test(skor)

# 3) n >= 50 icin Lilliefors duzeltmeli Kolmogorov-Smirnov
# install.packages("nortest")
nortest::lillie.test(veri$skor)

# 4) Grafik kontrol: histogram ve Q-Q grafigi
hist(veri$skor, main = "Histogram", xlab = "Skor")
qqnorm(veri$skor); qqline(veri$skor, col = "red")

# 5) Carpiklik ve basiklik katsayilari
# install.packages("psych")
psych::describe(veri$skor)   # skew ve kurtosis sutunlari

jamovi ile normallik testi

jamovi'de normallik kontrolü betimsel istatistik modülünün içindedir:

Analyses → Exploration → Descriptives
Statistics → Skewness, Kurtosis, Shapiro-Wilk  ·  Plots → Q-Q Plots

Değişkeninizi 'Variables' alanına taşıyın; grup bazında sonuç için grup değişkenini 'Split by' alanına ekleyin. Statistics panelinden Skewness, Kurtosis ve Shapiro-Wilk kutucuklarını, Plots panelinden Q-Q seçeneğini işaretleyin. Çıktı tablosu her grup için çarpıklık, basıklık, standart hataları ve Shapiro-Wilk p değerini birlikte verir.

Normallik sağlanmazsa ne yapılır?

İlk ve en yaygın seçenek, planlanan parametrik testin non-parametrik karşılığına geçmektir:

Parametrik test Non-parametrik karşılığı
Bağımsız örneklem t-testiMann-Whitney U
Eşleştirilmiş t-testiWilcoxon işaretli sıralar
Tek yönlü ANOVAKruskal-Wallis
Tekrarlı ölçümlü ANOVAFriedman
Pearson korelasyonuSpearman rho

İkinci seçenek veri dönüşümüdür: sağa çarpık verilerde logaritmik (log) veya karekök dönüşümü dağılımı normale yaklaştırabilir. Ancak dikkat: dönüşüm yorumlamayı zorlaştırır (sonuçlar artık dönüştürülmüş ölçek üzerindedir), sıfır ve negatif değerlerde ek düzeltme gerektirir ve her zaman işe yaramaz. Üçüncü seçenek sağlam (robust) yöntemlerdir: varyans homojenliği de sorunluysa Welch t-testi veya Welch ANOVA, aykırı değer ağırlıklı sorunlarda kırpılmış ortalamalara dayalı testler ya da bootstrap güven aralıkları düşünülebilir.

Karar akışı özeti

  1. Analiz birimini belirleyin: bağımsız gruplarda her grup ayrı, eşleştirilmiş desende fark puanları, ANOVA/regresyonda artıklar.
  2. Shapiro-Wilk uygulayın (n ≤ 5000); n ≥ 50 ise Lilliefors düzeltmeli K-S de rapor edilebilir.
  3. Çarpıklık ve basıklığa bakın: ±1 ideal, ±2 kabul edilebilir üst sınır.
  4. Histogram ve Q-Q grafiğini inceleyin; büyük örneklemde grafiklere ve katsayılara öncelik verin.
  5. Kanıtlar normale yakınlığı destekliyorsa parametrik testi kullanın; desteklemiyorsa non-parametrik karşılığa, dönüşüme veya sağlam yönteme geçin ve kararınızı raporda gerekçelendirin.
Örnek APA raporu: Normallik varsayımı Shapiro-Wilk testi, çarpıklık-basıklık katsayıları ve Q-Q grafikleriyle incelenmiştir. Deney grubunda puanlar normal dağılım göstermiştir, W = 0.97, p = .489; kontrol grubunda da normal dağılımdan anlamlı sapma saptanmamıştır, W = 0.96, p = .312. Çarpıklık (−0.42 ile 0.35) ve basıklık (−0.61 ile 0.28) katsayıları ±1 aralığında kalmıştır. (Değerler örnektir; kendi çıktınızdaki değerleri kullanın.)
Example APA report: The normality assumption was examined with the Shapiro-Wilk test, skewness-kurtosis coefficients and Q-Q plots. Scores were normally distributed in the experimental group, W = 0.97, p = .489, and no significant deviation from normality was found in the control group, W = 0.96, p = .312. Skewness (−0.42 to 0.35) and kurtosis (−0.61 to 0.28) coefficients remained within ±1. (Values are illustrative; use those from your own output.)

Sık sorulan sorular

Normallik testinde p > .05 ne demek?

Shapiro-Wilk ve K-S testlerinde sıfır hipotezi 'veri normal dağılımdan gelir' biçimindedir. p > .05 ise bu hipotez reddedilemez: normal dağılımdan anlamlı bir sapma saptanmamıştır ve varsayım karşılanmış kabul edilir. p < .05 ise normalden anlamlı sapma vardır; diğer kanıtlarla birlikte değerlendirilmelidir.

n = 200'de Shapiro anlamlı çıktı ama histogram normal görünüyor?

Büyük örneklemlerde normallik testleri aşırı güçlenir ve pratik açıdan önemsiz sapmaları bile anlamlı bulur. Karar tek başına p değerine bırakılmamalı; çarpıklık-basıklık (±1, en fazla ±2) ve histogram ile Q-Q grafiği birlikte değerlendirilmelidir. Bunlar normale yakınlığı gösteriyorsa parametrik test kullanılabilir; merkezi limit teoremi de büyük örneklemlerde ortalamalara dayalı testleri destekler.

Çarpıklık 1.5 çıktı — parametrik test kullanabilir miyim?

1.5, ±1 ideal aralığının dışında ama ±2 kabul edilebilir üst sınırının (George & Mallery, 2010) içindedir. Histogram ve Q-Q grafiği ciddi bir bozulma göstermiyorsa ve örneklem yeterince büyükse parametrik test savunulabilir. Yine de sınırda bir durumdur; non-parametrik karşılıkla sonuçların tutarlılığını kontrol etmek güvenli bir stratejidir.

Hangi grafiğe bakmalıyım?

İki grafik birlikte kullanılır: histogram dağılımın genel biçimini (tek tepe, simetri, aykırı değerler) gösterir; Q-Q grafiği gözlenen değerleri kuramsal normal kantillerle karşılaştırır. Q-Q grafiğinde noktalar referans doğrusunun üzerinde veya çok yakınında sıralanıyorsa dağılım normale yakındır; uçlardaki sistematik sapmalar kuyruk problemine işaret eder.

İlgili araçlar ve rehberler

Kaynaklar

George, D., & Mallery, P. (2010). SPSS for Windows step by step: A simple guide and reference, 17.0 update (10th ed.). Pearson.
Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21–33.
Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality (complete samples). Biometrika, 52(3–4), 591–611.
Tabachnick, B. G., & Fidell, L. S. (2013). Using multivariate statistics (6th ed.). Pearson.

Varsayım kontrolleri kafanızı mı karıştırdı?

Verinize uygun test seçimini, varsayım kontrollerini ve APA raporlamayı birlikte planlayalım.

Ücretsiz Ön Görüşme