Üç veya daha fazla bağımsız grubun ortalamasını karşılaştırmak için tek yönlü ANOVA kullanılır. Bu rehberde R'da aov() ile model kurmayı, varsayım kontrollerini, eta kare etki büyüklüğünü, Tukey HSD ve Games-Howell post-hoc testlerini, Kruskal-Wallis alternatifini ve sonuçların APA formatında nasıl raporlanacağını çalışan kod örnekleriyle gösteriyoruz.
Tek yönlü varyans analizi (one-way ANOVA), tek bir kategorik bağımsız değişkenin üç veya daha fazla düzeyinde (grubunda) sürekli bir bağımlı değişkenin ortalamalarını karşılaştırır. Örneğin üç farklı öğretim yönteminin başarı puanına etkisi ya da üç tanı grubunun ölçek puanları tek yönlü ANOVA ile incelenir.
Sık sorulan soru şudur: 'Neden üç grubu ikişer ikişer t-testiyle karşılaştırmıyoruz?' Çünkü her t-testi %5 Tip I hata payı taşır; üç grup için üç ayrı t-testi yapıldığında en az bir yanlış anlamlı sonuç bulma olasılığı yaklaşık %14'e yükselir (1 − 0.95³). Grup sayısı arttıkça bu şişme hızla büyür. ANOVA, tüm grupları tek bir omnibus F testiyle karşılaştırarak hata oranını %5'te tutar; farkın hangi gruplar arasında olduğu ise düzeltmeli post-hoc testlerle aranır.
Rehber boyunca üç gruplu (A, B, C), her grupta 20 gözlem bulunan yapay bir veri kullanacağız. Kodu olduğu gibi çalıştırarak tüm adımları kendi bilgisayarınızda yeniden üretebilirsiniz.
# Ornek veri: 3 grup x 20 gozlem
set.seed(7)
veri <- data.frame(
grup = rep(c("A", "B", "C"), each = 20),
skor = c(rnorm(20, 70, 9), rnorm(20, 74, 9), rnorm(20, 81, 9))
)
head(veri)
table(veri$grup)Tek yönlü ANOVA'nın iki temel varsayımı vardır: normallik ve varyans homojenliği. Normallik grup bazında ya da model artıkları (residuals) üzerinden test edilebilir; varyans homojenliği için Levene testi standarttır.
# 1) Normallik — grup bazinda Shapiro-Wilk (rstatix)
library(dplyr)
library(rstatix)
veri %>%
group_by(grup) %>%
shapiro_test(skor)
# 1b) Alternatif: model artiklarinin normalligi
model <- aov(skor ~ grup, data = veri)
shapiro.test(residuals(model))
# 2) Varyans homojenligi — Levene testi
# install.packages("car")
car::leveneTest(skor ~ grup, data = veri)Her iki Shapiro-Wilk yaklaşımında da p > .05 normallik lehine yorumlanır. Levene testinde p > .05 ise varyanslar homojen kabul edilir ve klasik ANOVA sürdürülür; p < .05 ise aşağıda anlatılan Welch ANOVA yoluna geçilir. Normallik kontrolünün ayrıntıları için normallik testi rehberimize bakabilirsiniz.
# Tek yonlu ANOVA modeli model <- aov(skor ~ grup, data = veri) summary(model) # Grup ortalamalari ve standart sapmalar (rapor icin) veri %>% group_by(grup) %>% summarise(n = n(), ort = mean(skor), ss = sd(skor))
summary(model) çıktısında 'grup' satırı gruplar arası, 'Residuals' satırı gruplar içi varyansı gösterir. Raporlanacak değerler şunlardır: F değeri ('F value' sütunu), iki serbestlik derecesi (grup satırındaki Df = gruplar arası sd, Residuals satırındaki Df = gruplar içi sd) ve p değeri ('Pr(>F)' sütunu). Örneğin Df satırları 2 ve 57 ise sonuç F(2, 57) biçiminde yazılır. p < .05 ise en az iki grup ortalaması birbirinden anlamlı biçimde farklıdır; hangi ikililerin farklı olduğunu omnibus test söylemez, bunun için post-hoc test gerekir.
p değeri farkın var olup olmadığını, eta kare ise farkın ne kadar büyük olduğunu söyler: bağımlı değişkendeki varyansın yüzde kaçının grup üyeliğiyle açıklandığını gösterir. Cohen'in (1988) yaygın kullanılan eşiklerine göre η² = .01 küçük, .06 orta, .14 büyük etkidir.
# Etki buyuklugu: eta kare
# install.packages("effectsize")
effectsize::eta_squared(model)
# Esikler: .01 kucuk, .06 orta, .14 buyuk (Cohen, 1988)Varyanslar homojense standart seçim Tukey HSD'dir. Çıktıda her satır bir ikili karşılaştırmayı gösterir: 'diff' ortalama farkı, 'lwr' ve 'upr' %95 güven aralığını, 'p adj' ise çoklu karşılaştırma için düzeltilmiş p değerini verir. Güven aralığı sıfırı içermiyorsa (ve p adj < .05 ise) o ikili fark anlamlıdır.
# Varyanslar homojen ise: Tukey HSD TukeyHSD(model)
Levene testi anlamlıysa (varyanslar homojen değilse) klasik F yerine Welch ANOVA, Tukey yerine de Games-Howell kullanılır (Games & Howell, 1976):
# Varyanslar homojen degilse: Welch ANOVA oneway.test(skor ~ grup, data = veri) # Welch sonrasi post-hoc: Games-Howell (rstatix) veri %>% games_howell_test(skor ~ grup)
Normallik ciddi biçimde ihlal edilmişse (özellikle küçük örneklemlerde) tek yönlü ANOVA'nın non-parametrik karşılığı Kruskal-Wallis testidir. Anlamlı sonucun ardından ikili karşılaştırmalar Bonferroni düzeltmeli Dunn testiyle yapılır; etki büyüklüğü olarak epsilon kare raporlanabilir.
# Kruskal-Wallis testi kruskal.test(skor ~ grup, data = veri) # Ikili karsilastirmalar: Dunn testi (Bonferroni duzeltmeli) veri %>% dunn_test(skor ~ grup, p.adjust.method = "bonferroni") # Etki buyuklugu (epsilon kare) veri %>% kruskal_effsize(skor ~ grup)
Not: Cümledeki değerler örnek amaçlıdır; kendi çıktınızdaki F, p, η², ortalama ve standart sapma değerlerini kullanın. İstatistik sembolleri (F, p, M, SD) APA'ya göre italik yazılır; η² italik yazılmaz.
Note: The values in the sentence are illustrative; use the F, p, η², mean and standard deviation values from your own output. Statistical symbols (F, p, M, SD) are italicised per APA; η² is not italicised.
Evet, nadiren mümkündür. Omnibus F testi ile ikili karşılaştırmalar farklı sorulara farklı güçle yanıt verir; F testi grupların doğrusal bir bileşimindeki farkı yakalayabilirken, çoklu karşılaştırma düzeltmesi ikili testlerin gücünü düşürür. Böyle bir durumda en büyük farkın hangi gruplar arasında olduğu betimsel olarak raporlanır ve örneklem gücünün sınırlılığı tartışılır.
Levene testinin anlamlı olması varyans homojenliği varsayımının ihlal edildiğini gösterir. Klasik ANOVA yerine Welch ANOVA (oneway.test) raporlanmalı, post-hoc karşılaştırmalarda da Tukey yerine eşit varyans varsaymayan Games-Howell testi kullanılmalıdır.
Teknik olarak evet: iki gruplu tek yönlü ANOVA, bağımsız örneklem t-testine matematiksel olarak denktir ve F = t² eşitliği geçerlidir. Uygulamada iki grup için t-testi raporlamak gelenektir; ANOVA üç ve daha fazla grup için tercih edilir.
Tek faktörlü (tek yönlü) ANOVA'da eta kare ile kısmi eta kare aynı değeri verir, çünkü modelde başka faktör yoktur; hangisinin adlandırıldığı fark yaratmaz. Yalnızca raporda kullanılan sembolün tutarlı olmasına dikkat edin. Çok faktörlü desenlerde iki ölçü ayrışır ve genellikle kısmi eta kare raporlanır.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Lawrence Erlbaum.
Field, A. (2018). Discovering statistics using IBM SPSS Statistics (5th ed.). Sage.
Games, P. A., & Howell, J. F. (1976). Pairwise multiple comparison procedures with unequal n's and/or variances: A Monte Carlo study. Journal of Educational Statistics, 1(2), 113–125.
Varsayım kontrolünden APA tablolarına kadar tez ve makale analizlerinizde uzman desteği alın.
Ücretsiz Ön Görüşme