Normallik için hangi grafiğe bakmalıyım?

İki grafik birlikte kullanılır: histogram dağılımın genel biçimini (tek tepe, simetri, aykırı değer) gösterir; Q-Q grafiği ise gözlenen değerleri kuramsal normal dağılım kantilleriyle karşılaştırır. Q-Q grafiğinde noktalar referans doğrusu üzerinde veya çok yakınında sıralanıyorsa dağılım normale yakındır; uçlarda sistematik sapmalar kuyruk problemine işaret eder.

Normallik Testi Nasıl Yapılır? Shapiro-Wilk, Çarpıklık-Basıklık (R + Jamovi)

Q: Normallik testinde p > .05 ne demek?

Shapiro-Wilk veya Kolmogorov-Smirnov testinde sıfır hipotezi 'veri normal dağılımdan gelir' biçimindedir. p > .05 ise bu hipotez reddedilemez; yani normal dağılımdan anlamlı bir sapma saptanmamıştır ve normallik varsayımı karşılanmış kabul edilir. p < .05 ise normal dağılımdan anlamlı sapma vardır.

Q: n = 200 iken Shapiro-Wilk anlamlı çıktı ama histogram normal görünüyor; ne yapmalıyım?

Büyük örneklemlerde normallik testleri aşırı güçlenir ve önemsiz sapmaları bile anlamlı bulur. Bu durumda karar tek başına p değerine bırakılmamalı; çarpıklık-basıklık katsayıları (±1, en fazla ±2) ve histogram ile Q-Q grafiği birlikte değerlendirilmelidir. Bunlar normale yakınlık gösteriyorsa parametrik test kullanılabilir; merkezi limit teoremi de büyük örneklemlerde ortalamalara dayalı testleri destekler.

Q: Çarpıklık katsayısı 1.5 çıktı; parametrik test kullanabilir miyim?

1.5 değeri ±1 ideal aralığının dışında, ancak George ve Mallery'nin (2010) kabul edilebilir üst sınırı olan ±2'nin içindedir. Histogram ve Q-Q grafiği ciddi bir bozulma göstermiyorsa ve örneklem yeterince büyükse parametrik test savunulabilir; yine de sınırda bir durumdur ve non-parametrik karşılığıyla sonuçların tutarlılığını kontrol etmek güvenli bir stratejidir.

İçindekiler

Normallik varsayımı neden önemli?
Hangi test ne zaman kullanılır?
Çarpıklık-basıklık eşikleri
Normallik nerede test edilir?
R ile normallik testi
jamovi ile normallik testi
Normallik sağlanmazsa
Karar akışı özeti
Sık sorulan sorular

Normallik varsayımı neden önemli?

Bağımsız örneklem t-testi, eşleştirilmiş t-testi, tek yönlü ve tekrarlı ölçümlü ANOVA ile Pearson korelasyonu gibi parametrik testler, verilerin (ya da modele göre fark puanlarının veya artıkların) normal dağıldığı varsayımına dayanır. Varsayım ciddi biçimde ihlal edildiğinde p değerleri ve güven aralıkları yanıltıcı olabilir: Tip I hata oranı nominal düzeyden sapar ve testin gücü düşer. Bu nedenle tez ve makalelerde parametrik test raporlamadan önce normallik kontrolünün nasıl yapıldığının açıkça belirtilmesi beklenir.

Kontrol tek bir sayıya indirgenmemelidir: iyi uygulama, test istatistiği (Shapiro-Wilk), betimsel katsayılar (çarpıklık-basıklık) ve grafiklerin (histogram, Q-Q) birlikte değerlendirilmesidir.

Hangi test ne zaman kullanılır?

Örneklem büyüklüğü	Önerilen test	Açıklama
n < 50	Shapiro-Wilk	Küçük örneklemde standart tercih
n ≥ 50	Kolmogorov-Smirnov (Lilliefors düzeltmeli)	Geleneksel eşik; SPSS 'Explore' çıktısındaki K-S budur

Önemli bir ek: Shapiro-Wilk testi yalnızca küçük örneklemlere özgü değildir; n ≤ 5000'e kadar geçerlidir ve simülasyon çalışmalarında Kolmogorov-Smirnov'a göre genellikle daha güçlü bulunmuştur (Razali & Wah, 2011). Bu nedenle çoğu durumda Shapiro-Wilk'i birincil test olarak raporlamak, K-S'yi ise gelenek gereği ek olarak sunmak savunulabilir bir stratejidir.

Çarpıklık-basıklık kaç olmalı?

Çarpıklık (skewness) dağılımın simetrisini, basıklık (kurtosis) kuyruk ağırlığını gösterir. Yaygın kabul gören eşikler şöyledir: ±1 aralığı ideal kabul edilir (George & Mallery, 2010); ±2 aralığı ise birçok kaynakta kabul edilebilir üst sınır olarak anılır. Tabachnick ve Fidell (2013) büyük örneklemlerde katsayıların standart hatalarının küçüldüğünü, bu yüzden mutlak değerlerin ve grafiklerin birlikte yorumlanması gerektiğini vurgular.

Alternatif bir yaklaşım z-skorudur: çarpıklık (veya basıklık) katsayısı kendi standart hatasına bölünür. Elde edilen z değeri, küçük örneklemlerde ±1.96, orta büyüklükte ±2.58 sınırıyla karşılaştırılır; büyük örneklemlerde ise bu yaklaşım aşırı duyarlı hale geldiği için önerilmez.

z_carpiklik = carpiklik / SH(carpiklik) z_basiklik = basiklik / SH(basiklik)

Normallik nerede test edilir? (En sık yapılan hata)

En sık yapılan hata, normallik testini tüm örneklem üzerinde tek seferde çalıştırmaktır. Doğru düzey, kullanılacak analize göre değişir:

Bağımsız gruplar (bağımsız t-testi, tek yönlü ANOVA): normallik HER GRUPTA AYRI AYRI test edilir. İki grubun karışımı çift tepeli görünebilir; grupların her biri normalse varsayım karşılanmıştır.
Eşleştirilmiş desen (eşleştirilmiş t-testi, ön test-son test): normallik ham puanlarda değil, FARK PUANLARINDA (son test − ön test) test edilir.
ANOVA ve regresyon: teknik varsayım model ARTIKLARININ (residuals) normalliğidir; artıklar üzerinde tek bir test yeterlidir. Tek yönlü ANOVA'da grup bazında test etmek de eşdeğer ve yaygın bir uygulamadır.

R ile normallik testi

Aşağıdaki kod bloğu, örnek bir veri üzerinde tüm normallik kontrollerini gösterir; kendi verinizde değişken adlarını değiştirmeniz yeterlidir.

# Ornek veri: iki gruplu bir calisma
set.seed(42)
veri <- data.frame(
  grup = rep(c("Deney", "Kontrol"), each = 30),
  skor = c(rnorm(30, 75, 10), rnorm(30, 70, 10))
)

# 1) Tek degisken icin Shapiro-Wilk
shapiro.test(veri$skor)

# 2) Grup bazinda Shapiro-Wilk (rstatix paketi)
library(dplyr)
library(rstatix)
veri %>%
  group_by(grup) %>%
  shapiro_test(skor)

# 3) n >= 50 icin Lilliefors duzeltmeli Kolmogorov-Smirnov
# install.packages("nortest")
nortest::lillie.test(veri$skor)

# 4) Grafik kontrol: histogram ve Q-Q grafigi
hist(veri$skor, main = "Histogram", xlab = "Skor")
qqnorm(veri$skor); qqline(veri$skor, col = "red")

# 5) Carpiklik ve basiklik katsayilari
# install.packages("psych")
psych::describe(veri$skor)   # skew ve kurtosis sutunlari

jamovi ile normallik testi

jamovi'de normallik kontrolü betimsel istatistik modülünün içindedir:

Analyses → Exploration → Descriptives

Statistics → Skewness, Kurtosis, Shapiro-Wilk · Plots → Q-Q Plots

Değişkeninizi 'Variables' alanına taşıyın; grup bazında sonuç için grup değişkenini 'Split by' alanına ekleyin. Statistics panelinden Skewness, Kurtosis ve Shapiro-Wilk kutucuklarını, Plots panelinden Q-Q seçeneğini işaretleyin. Çıktı tablosu her grup için çarpıklık, basıklık, standart hataları ve Shapiro-Wilk p değerini birlikte verir.

Normallik sağlanmazsa ne yapılır?

İlk ve en yaygın seçenek, planlanan parametrik testin non-parametrik karşılığına geçmektir:

Parametrik test	Non-parametrik karşılığı
Bağımsız örneklem t-testi	Mann-Whitney U
Eşleştirilmiş t-testi	Wilcoxon işaretli sıralar
Tek yönlü ANOVA	Kruskal-Wallis
Tekrarlı ölçümlü ANOVA	Friedman
Pearson korelasyonu	Spearman rho

İkinci seçenek veri dönüşümüdür: sağa çarpık verilerde logaritmik (log) veya karekök dönüşümü dağılımı normale yaklaştırabilir. Ancak dikkat: dönüşüm yorumlamayı zorlaştırır (sonuçlar artık dönüştürülmüş ölçek üzerindedir), sıfır ve negatif değerlerde ek düzeltme gerektirir ve her zaman işe yaramaz. Üçüncü seçenek sağlam (robust) yöntemlerdir: varyans homojenliği de sorunluysa Welch t-testi veya Welch ANOVA, aykırı değer ağırlıklı sorunlarda kırpılmış ortalamalara dayalı testler ya da bootstrap güven aralıkları düşünülebilir.

Karar akışı özeti

Analiz birimini belirleyin: bağımsız gruplarda her grup ayrı, eşleştirilmiş desende fark puanları, ANOVA/regresyonda artıklar.
Shapiro-Wilk uygulayın (n ≤ 5000); n ≥ 50 ise Lilliefors düzeltmeli K-S de rapor edilebilir.
Çarpıklık ve basıklığa bakın: ±1 ideal, ±2 kabul edilebilir üst sınır.
Histogram ve Q-Q grafiğini inceleyin; büyük örneklemde grafiklere ve katsayılara öncelik verin.
Kanıtlar normale yakınlığı destekliyorsa parametrik testi kullanın; desteklemiyorsa non-parametrik karşılığa, dönüşüme veya sağlam yönteme geçin ve kararınızı raporda gerekçelendirin.

Örnek APA raporu: Normallik varsayımı Shapiro-Wilk testi, çarpıklık-basıklık katsayıları ve Q-Q grafikleriyle incelenmiştir. Deney grubunda puanlar normal dağılım göstermiştir, W = 0.97, p = .489; kontrol grubunda da normal dağılımdan anlamlı sapma saptanmamıştır, W = 0.96, p = .312. Çarpıklık (−0.42 ile 0.35) ve basıklık (−0.61 ile 0.28) katsayıları ±1 aralığında kalmıştır. (Değerler örnektir; kendi çıktınızdaki değerleri kullanın.)

Example APA report: The normality assumption was examined with the Shapiro-Wilk test, skewness-kurtosis coefficients and Q-Q plots. Scores were normally distributed in the experimental group, W = 0.97, p = .489, and no significant deviation from normality was found in the control group, W = 0.96, p = .312. Skewness (−0.42 to 0.35) and kurtosis (−0.61 to 0.28) coefficients remained within ±1. (Values are illustrative; use those from your own output.)

Sık sorulan sorular

Normallik testinde p > .05 ne demek?

Shapiro-Wilk ve K-S testlerinde sıfır hipotezi 'veri normal dağılımdan gelir' biçimindedir. p > .05 ise bu hipotez reddedilemez: normal dağılımdan anlamlı bir sapma saptanmamıştır ve varsayım karşılanmış kabul edilir. p < .05 ise normalden anlamlı sapma vardır; diğer kanıtlarla birlikte değerlendirilmelidir.

n = 200'de Shapiro anlamlı çıktı ama histogram normal görünüyor?

Büyük örneklemlerde normallik testleri aşırı güçlenir ve pratik açıdan önemsiz sapmaları bile anlamlı bulur. Karar tek başına p değerine bırakılmamalı; çarpıklık-basıklık (±1, en fazla ±2) ve histogram ile Q-Q grafiği birlikte değerlendirilmelidir. Bunlar normale yakınlığı gösteriyorsa parametrik test kullanılabilir; merkezi limit teoremi de büyük örneklemlerde ortalamalara dayalı testleri destekler.

Çarpıklık 1.5 çıktı — parametrik test kullanabilir miyim?

1.5, ±1 ideal aralığının dışında ama ±2 kabul edilebilir üst sınırının (George & Mallery, 2010) içindedir. Histogram ve Q-Q grafiği ciddi bir bozulma göstermiyorsa ve örneklem yeterince büyükse parametrik test savunulabilir. Yine de sınırda bir durumdur; non-parametrik karşılıkla sonuçların tutarlılığını kontrol etmek güvenli bir stratejidir.

Hangi grafiğe bakmalıyım?

İki grafik birlikte kullanılır: histogram dağılımın genel biçimini (tek tepe, simetri, aykırı değerler) gösterir; Q-Q grafiği gözlenen değerleri kuramsal normal kantillerle karşılaştırır. Q-Q grafiğinde noktalar referans doğrusunun üzerinde veya çok yakınında sıralanıyorsa dağılım normale yakındır; uçlardaki sistematik sapmalar kuyruk problemine işaret eder.

İlgili araçlar ve rehberler

Kaynaklar

George, D., & Mallery, P. (2010). SPSS for Windows step by step: A simple guide and reference, 17.0 update (10th ed.). Pearson.
Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal of Statistical Modeling and Analytics, 2(1), 21–33.
Shapiro, S. S., & Wilk, M. B. (1965). An analysis of variance test for normality (complete samples). Biometrika, 52(3–4), 591–611.
Tabachnick, B. G., & Fidell, L. S. (2013). Using multivariate statistics (6th ed.). Pearson.

Normallik Testi Nasıl Yapılır? Shapiro-Wilk ve Çarpıklık-Basıklık