Sadece başlık ile ilgili açıklığa kavuşturmak için, t-dağılımını ortalamayı tahmin etmek için kullanmıyoruz (en azından bir nokta tahmini anlamında), ancak bunun için bir aralık oluşturmak için kullanıyoruz.
Ama neden güven aralığınızı tam olarak alabileceğinizi tahmin edesiniz?
Bu iyi bir soru ('tam olarak' çok fazla ısrarcı olmadığımız sürece, tam olarak t dağıtılmış olduğu varsayımları gerçekten geçerli olmayacaktır).
"Çalışma popülasyonu standart sapması (σ) bilinmediğinde ve örnek boyutu küçük olduğunda (n <30) çalışma problemleri sırasında t-dağılım tablosunu kullanmalısınız"
Niçin insanlar popülasyon standart sapması bilinmediğinde (n> 30 olsa bile) T dağılımını her zaman kullanmıyorlar?
Tavsiyeyi - en iyi ihtimalle - potansiyel olarak yanıltıcı olarak görüyorum. Bazı durumlarda, t-dağılımı, serbestlik dereceleri bundan daha büyük olduğunda hala kullanılmalıdır.
Normalin makul bir yaklaşım olduğu yerlerde çeşitli şeylere bağlıdır (ve dolayısıyla duruma bağlıdır). Bununla birlikte, (bilgisayarlarda) sadece t kullanmak zor olmadığından, df çok büyük olsa bile, n = 30'da farklı bir şey yapmak için neden endişelenmeniz gerektiğini merak etmelisiniz.
Örnek boyutları gerçekten büyükse, bir güven aralığı arasında fark edilir bir fark yaratmaz, ancak n = 30'un her zaman 'gerçekten büyük' e yeterince yakın olduğunu düşünmüyorum.
t yerine normalin kullanılmasının mantıklı olabileceği bir durum vardır - bu, verilerinizin t dağılımı elde etme koşullarını açıkça karşılamadığı, ancak yine de ortalamanın yaklaşık normallikini tartışabilirsiniz (eğer n oldukça büyük). Bununla birlikte, bu durumlarda, t pratikte iyi bir yaklaşımdır ve bir şekilde 'daha güvenli' olabilir. [Böyle bir durumda, simülasyon yoluyla araştırma yapmaya eğilimli olabilirim.]