Hata payları, güven aralıkları ile nasıl ilişkilidir?

11

Birisi bana hata payları ile güven aralıkları arasındaki farkı söyleyebilir mi? İnternette bu iki anlamın birbirinin yerine kullanıldığını görüyorum.

Söylemek doğru mu?

"Güven aralıkları 1.96 olarak gösterilir ve grafiklerde hata payı olarak gösterilir"?

confidence-interval survey polling

— Mintuz
kaynak

1

Bu konuda yararlı tartışmalar sitemizde arama yaparak bulunabilir .

— whuber

13

İnternet hepimizin bildiği gibi çöp dolu. Bu tür sorunların çözümüne yardımcı olmak için yetkili kaynaklar bulmaya ve bunlara odaklanmaya yardımcı olur. Amerikan İstatistik Kurumu (Fritz Scheuren'e atfedilen ve "1997 dolaylarında tamamen güncellenen") tarafından yayınlanan bir broşür , hata payını% 95'lik bir güven aralığı olarak tanımlamaktadır (sağda 64).

Bunun ışığında, hata payı hakkındaki Wikipedia makalesinin, bu broşürü referans almasına rağmen farklı bir tanım kullanması şaşırtıcı ! Wikipedia yazıyor,

Hata payı genellikle bir anketteki belirli bir istatistik için güven aralığının "yarıçapı" (veya genişliğinin yarısı) olarak tanımlanır. ... Bir anket için tek bir global hata payı bildirildiğinde, anketin tam örneğini kullanan tüm rapor edilen yüzdeler için maksimum hata payını ifade eder.

Diğer bir deyişle, Vikipedi'ye Moe yarım maksimum (kapsamında bulunan% 95 farklı olabilir) güven aralıkları bir dizi genişliği.

Bu karışıklığı (veya en azından standardizasyon eksikliğini) bu sitenin başka yerlerindeki yorumlarda tartıştık. Bizim Sonuç olmasıydı ne net olması gerekir Eğer siz bu terimi her kullandığınızda "Hata payı" demek.

— whuber
kaynak

7

"Hata marjı" nın ne olduğuna dair evrensel olarak izlenen bir sözleşme yoktur, ancak bence (gözlemlediğiniz gibi), çoğunlukla tahminin orijinal ölçeğinde veya yüzde olarak bir güven aralığının yarıçapı olarak kullanılır. bir tahmin. Bazen "standart hata" ile eşanlamlı olarak kullanılır.

Bir "güven aralığı" yok onun anlamını evrensel kuralı mevcut. Temel olarak, bir tahmin süreci tarafından üretilen, zamanın% X'inin (% 95 en yaygın olarak kullanılan) tahmin edilen parametrenin gerçek değerini içereceği olası tahminler aralığıdır. Zamanın% X'inin gerçek değerini üretecek olan bu "süreç" kavramı, biraz sezgiseldir ve Bayesian çıkarımdan bir "güvenilirlik aralığı" ile karıştırılmamalıdır ; yaygın olarak kullanılan güven aralığıyla aynı şey değildir.

Gerçek teklifiniz biraz dağınık ve açıklandığı gibi küçük bir düzeltme gerektiriyor. Ben "margin" kelimesinin bu ek kullanımını önlemek ve "hata çubukları" lehine olacaktır. Yani:

"Güven aralıkları, ilgili standart hatalarla çarpılarak 1.96 olarak tahmin edilir ve grafiklerde hata çubukları olarak gösterilir."

(Bu, modelinize bağlı olan ve alakalı olmayan güven aralıklarını hesaplamanın iyi bir yolu olup olmadığı sorusunu bir kenara bırakır).

Terminoloji üzerine son yorum - "standart hatayı" sevmiyorum, bu sadece "tahminin standart sapması" anlamına gelir; ya da genel olarak "örnekleme hatası" - "Hatalar" yerine rastgele olma ve istatistiklerin varyansı açısından düşünmeyi tercih ederim. Ama sanırım çok yaygın bir şekilde kullanıldığı için yukarıdaki "standart hata" terimini kullanmaya başladım.

— Peter Ellis
kaynak