Oran için Wilson skor aralığı, ortalama için t dağılımına dayalı güven aralığını %90, %95 veya %99 güven düzeyinde hesaplayın. Sonuçlar R ile (prop.test ve qt fonksiyonlarıyla) doğrulanmıştır; hiçbir veri sunucuya gönderilmez.
Bir %95 güven aralığının doğru (frekansçı) yorumu şudur: aynı evrenden aynı yöntemle çok sayıda örneklem çekilip her birinden bir aralık hesaplansaydı, bu aralıkların yaklaşık %95'i gerçek evren değerini kapsardı. Sık yapılan yanlış yorum ise 'gerçek değerin bu aralıkta olma olasılığı %95'tir' ifadesidir: klasik çerçevede gerçek değer sabit (rastgele olmayan) bir sayıdır; %95 olasılık tek bir aralığa değil, aralık üretme yöntemine aittir. Pratikte güven aralığı, tahminin kesinliğini (belirsizlik payını) özetleyen en bilgilendirici araçlardan biridir ve p değeriyle birlikte raporlanması önerilir.
Ders kitaplarında sık görülen Wald aralığı (p̂ ± z·√(p̂(1−p̂)/n)) küçük örneklemlerde ve 0'a ya da 1'e yakın oranlarda nominal kapsamanın belirgin altında kalır; x = 0 veya x = n olduğunda ise sıfır genişlikte aralık üretir. Brown, Cai ve DasGupta (2001) rutin kullanım için Wilson (1927) skor aralığını önerir; bu araç da Wilson yöntemini kullanır:
Örnek: x = 30, n = 100, %95 güven düzeyi için Wilson aralığı [0.2189, 0.3958] olur — R'da prop.test(30, 100, correct = FALSE) ile birebir aynı sonuç elde edilir.
Evren standart sapması bilinmediğinde ortalamanın güven aralığı, n − 1 serbestlik dereceli t dağılımıyla kurulur:
Örnek: M = 50, SD = 10, n = 25, %95 güven düzeyi için kritik değer t(0.975, 24) = 2.0639 olup aralık [45.8722, 54.1278] bulunur. Bu araçtaki t kantili, düzenlenmiş tamamlanmamış beta fonksiyonunun sayısal tersine çevrilmesiyle hesaplanır ve R'ın qt() fonksiyonuyla en az 6 ondalık basamakta örtüşür.
→ Aralığı daraltmak için gerekli örneklemi hesaplayın: Örneklem Büyüklüğü aracı
→ Hipotez testleri için: Güç Analizi ve Örneklem Hesaplama aracı
Aynı yöntemle çok sayıda örneklem çekilip her birinden aralık hesaplansaydı, bu aralıkların yaklaşık %95'i (seçilen düzeye göre) gerçek evren değerini kapsardı. 'Gerçek değer %95 olasılıkla bu aralıktadır' ifadesi frekansçı çerçevede teknik olarak yanlıştır; olasılık yönteme aittir.
Bu bir denge sorunudur: %99 güven daha geniş, dolayısıyla daha az bilgilendirici bir aralık verir. Çoğu alanda gelenek %95'tir; yanlış kapsama maliyetinin yüksek olduğu durumlarda %99 tercih edilebilir. Düzeyi analizden önce belirleyin ve raporda açıkça yazın.
Klasik Wald aralığı küçük n'de ve uç oranlarda nominal kapsamanın altında kalır; x = 0 veya x = n'de sıfır genişlikte aralık verir. Wilson skor aralığı bu durumlarda da geçerlidir ve kapsama açısından çok daha iyidir (Brown, Cai ve DasGupta, 2001). R'daki prop.test(correct = FALSE) da Wilson aralığını verir.
Aralıklar genişler; bu, belirsizliğin dürüst bir yansımasıdır. Ortalama için t dağılımı küçük n'nin ek belirsizliğini hesaba katar, ancak normallik varsayımı küçük örneklemde daha kritiktir. Oran için Wilson aralığı küçük n'de de iyi çalışır. Aralığı daraltmanın temel yolu örneklemi büyütmektir.
Wilson, E. B. (1927). Probable inference, the law of succession, and statistical inference. Journal of the American Statistical Association, 22(158), 209–212.
Brown, L. D., Cai, T. T., & DasGupta, A. (2001). Interval estimation for a binomial proportion. Statistical Science, 16(2), 101–133.
Güven aralıkları, hipotez testleri ve raporlama dahil tüm istatistiksel analiz sürecinizi birlikte planlayalım.
Ücretsiz Ön Görüşme