Oranlar için güven aralıkları nasıl hesaplanır?


12

0 ile 1 arasında bir oranı bir deney düşünün . Bu sorunun önceki bir sürümünde ayrıntılı olarak ele alınmış , ancak meta ile ilgili bir tartışmadan sonra anlaşılır olması için kaldırılmıştır .Xi

Bu deney kez tekrarlanırken , küçüktür (yaklaşık 3-10). bağımsız aynen dağılma olduğu varsayılır. Bunlardan ortalama hesaplayarak ortalamayı tahmin ediyoruz , ancak karşılık gelen bir güven aralığını nasıl hesaplayacağız ?n X i ¯ X [ U , V ]nnXiX¯[U,V]

Güven aralıklarını hesaplamak için standart yaklaşımı kullanırken, bazen 1'den büyüktür. Ancak, sezgim doğru güven aralığının ...V

  1. ... 0 ve 1 aralığında olmalıdır
  2. ... artan ile küçülmelin
  3. ... kabaca standart yaklaşım kullanılarak hesaplanan sıraya göre
  4. ... matematiksel olarak sağlam bir yöntemle hesaplanır.

Bunlar mutlak gereklilikler değil, ama en azından sezgimin neden yanlış olduğunu anlamak istiyorum.

Mevcut cevaplara dayalı hesaplamalar

Aşağıda, mevcut cevaplardan kaynaklanan güven aralıkları .{Xi}={0.985,0.986,0.935,0.890,0.999}

Standart Yaklaşım (diğer adıyla "Okul Matematiği")

X¯=0.959 , , dolayısıyla% 99 güven aralığı . Bu sezgi 1 ile çelişmektedir.[ 0.865 , 1.053 ]σ2=0.0204[0.865,1.053]

Kırpma (yorumlarda @soakley tarafından önerilir)

Sadece standart yaklaşımı kullanarak sonuç olarak sağlamak kolaydır. Ama bunu yapmamıza izin var mı? Henüz alt sınırın sabit kaldığına ikna olmadım (-> 4.)[0.865,1.000]

Lojistik Regresyon Modeli (@Rose Hartman tarafından önerilmektedir)

Transforme veriler: sonuçlanan , dönüştürülmesi de sonuç geri . Açıkçası, 6.90 dönüştürülmüş veriler için bir aykırı değerken, 0.99 dönüştürülmemiş veriler için değildir, bu da çok büyük bir güven aralığı ile sonuçlanır . (-> 3.)[ 0.173 , 7.87 ] [ 0.543 , 0.999 ]{4.18,4.25,2.09,2.66,6.90}[0.173,7.87][0.543,0.999]

Binom orantı güven aralığı (@Tim tarafından önerilmektedir)

Yaklaşım oldukça iyi görünüyor, ancak maalesef deneye uymuyor. Sadece sonuçları bir araya getirmek ve @ZahavaKor tarafından önerildiği gibi tekrarlanan büyük bir Bernoulli deneyi olarak yorumlamak aşağıdaki sonuçları doğurur:

5 1000 [ 0.9511 , 0.9657 ] X i985+986+890+935+999=4795 999 = 4795 üzerinden toplam. Bunu Adj. Wald hesaplayıcı verir . Bu gerçekçi görünmüyor, çünkü o aralığın içinde tek bir ! (-> 3.)51000[0.9511,0.9657]Xi

Önyükleme (@soakley tarafından önerilir)

ile 3125 olası permütasyonumuz var. Alarak permütasyon orta araçları, bundan elde . O kadar da kötü gözükmese de daha geniş bir aralık beklerdim (-> 3.). Ancak, inşaat başına asla den daha büyük değildir . Böylece küçük bir örnek için (-> 2) arttırmak için küçülmek yerine büyüyecektir . En azından yukarıda verilen örneklerle olan budur.3093n=5[0,91,0,99][min(Xi),max(Xi)]n30933125=0.99[0.91,0.99][min(Xi),max(Xi)]n


İkinci yaklaşımınızda haklısınız. Birincisi hakkında emin değilim - istatistiksel olarak açıkça belirtilmedi. Bildiğim kadarıyla, tekrarlanabilirlik aynı deneyin farklı bir araştırmacı tarafından yapıldığı ve benzer sonuçlar aldıkları anlamına gelir. Hedefinizi daha açık bir şekilde, tercihen tahmin etmeye çalıştığınız parametreye ilişkin istatistiksel bir hipotez olarak belirtmeniz gerekir. Sadece "tekrarlanabilirlik" terimini kullanmak bence çok belirsiz.
Zahava Kor

Haklısınız, tekrarlanabilirlik doğru terimdir ve tekrarlanabilirlik değildir. İstatistiksel olarak bir tanım yapmaya çalışacağım.
koalo

@ZahavaKor Tekrarlanabilirlik ile ilgili örneksizliğimi kaldırdım ve gerçek başvurumu, sorunumu açıklığa kavuşturacağını ve karıştırmamasını umarak belirttim.
koalo

Gerçekten 1000 büyüklüğünde numuneler alıyorsanız, yeniden örnekleme yaklaşımını doğru bir şekilde uygulamadınız. Ancak bu kadar veri ile, yeniden örneklemeye ihtiyacınız yoktur ve yukarıda bulduğunuz gibi standart binomiyal yaklaşımla iyi sonuçlar (yani dar güven aralıkları) almalısınız. Tek tek veri noktalarınızın sonuçlanan aralıkta olmaması aralığın yanlış olduğu anlamına gelmez.
soakley

1
Bunu bir düşün. 10 öğe örnek ve 9 başarılar elde. 1000 örnek alıyorum ve 900 başarı elde ediyorum. Ortalamanın daha doğru tahminini kim yapacak? Sezgi henüz orada değilse, Tim tarafından başvurulan formülü kullanmayı deneyin. Yani sorunuzun son örneğinde, örnek boyutu 5 değil, 5000'dir!
soakley

Yanıtlar:


6

Birincisi, açıklamak gerekirse, sorunuzun önerdiği gibi, bir ikili dağılım değildir (Bernoulli deneyi olarak adlandırırsınız). Binom dağılımları ayrıktır - sonuç ya başarı ya da başarısızlıktır. Sonucunuz, denemenizi her çalıştırdığınızda bir orandır , daha sonra bir özet oran hesapladığınız bir dizi başarı ve başarısızlık değildir. Bu nedenle, binom orantı güven aralığını hesaplama yöntemleri, birçok bilginizi atar. Ve yine de, değişkeninizin olası aralığını aşan bir CI alabileceğiniz için bunu normal şekilde dağıtılmış gibi işlemenin sorunlu olduğunu doğru söylüyorsunuz.

Bunu lojistik regresyon açısından düşünmenizi tavsiye ederim. Sonuç olarak oran değişkeninizle birlikte tahminci olmayan bir lojistik regresyon modeli çalıştırın. Kesişme ve CI, günlüklerde ihtiyacınız olanı size verecektir ve daha sonra tekrar oranlara dönüştürebilirsiniz. Ayrıca lojistik dönüşümü kendiniz yapabilir, CI'yi hesaplayabilir ve ardından orijinal ölçeğe geri dönüştürebilirsiniz. Python'um korkunç, ama bunu R'de nasıl yapabileceğiniz aşağıda açıklanmıştır:

set.seed(24601)
data <- rbeta(100, 10, 3)
hist(data)

ham verilerin histogramı

data_logits <- log(data/(1-data)) 
hist(data_logits)

logit dönüştürülmüş verilerin histogramı

# calculate CI for the transformed data
mean_logits <- mean(data_logits)
sd <- sd(data_logits)
n <- length(data_logits)
crit_t99 <- qt(.995, df = n-1) # for a CI99
ci_lo_logits <- mean_logits - crit_t * sd/sqrt(n)
ci_hi_logits <- mean_logits + crit_t * sd/sqrt(n)

# convert back to ratio
mean <- exp(mean_logits)/(1 + exp(mean_logits))
ci_lo <- exp(ci_lo_logits)/(1 + exp(ci_lo_logits))
ci_hi <- exp(ci_hi_logits)/(1 + exp(ci_hi_logits))

Bu veriler için% 99 CI'nın alt ve üst sınırları şunlardır:

> ci_lo
[1] 0.7738327
> ci_hi
[1] 0.8207924

Bu iyi bir yaklaşım gibi görünüyor, ancak sonuçlar sezgisel olarak beklediğim gibi değil: 0.99,0.94,0.94 için data_logits [-2.73,9.47] güven aralığı vererek 4.59,2.75,2,75. Bunu geri dönüştürmek [0.061,0.999] verir - beklediğimden çok daha büyük.
koalo

1
Sadece üç gözlem için çok geniş bir güven aralığı beklemelisiniz. Histogramınızdan, üçten fazla gözleminiz var gibi görünüyor --- 0.99,0.94,0.94 ile örneğinizi sadece göstermek için olduğunu varsaydım. Gerçek örneklem büyüklüğünüz üç ise, güven aralıklarının hiç hesaplanmasını önermem (veya bu konuda ortalama).
Rose Hartman

Yukarıdaki histogram sorunumu göstermek için python betiğinden geliyor. Gerçek dünya denemesinden bu kadar çok ölçüm alamıyorum. En azından her parametre kombinasyonu için değil. Son değerlendirmede 3'ün çok küçük olabileceğini ve belki de yaklaşık 10'un mümkün olacağını kabul ediyorum, ama kesinlikle çok daha fazla değil. Öyleyse, sadece tek bir ölçüm almak için şanslı olmadığımı göstermek için değil, deneyi tekrarlamanın tamamen farklı sonuçlar vermediğini göstermek için ne yapmalıyım?
koalo

@RoseHartman Bu güzel ve net bir açıklama ama yönteminizin sorudaki veri örneğine (n = 5) uygulandığını görmek de iyi olur.
PM.

@scitamehtam Yanıtımı koalo örnek verileri sağlamadan önce yazdım ve örneklem büyüklüğünün 10 veya daha az gözlem olacağını açıkladım. koalo o zamandan beri orijinal soruyu n = 5 verisiyle her cevap yönteminden çalışılmış örnekleri içerecek şekilde güncelledi.
Rose Hartman

3

Yeniden örneklemeyi / önyüklemeyi denemek isteyebilirsiniz. Bahsettiğiniz basit duruma bakalım.

0,99, 0,94 ve 0,94 olan 3 veri noktasıyla, yeniden örneklemeyi bile yapmazsınız çünkü 27 olası permütasyonun tümünü listeleyebilir, her durumda ortalamayı bulabilir ve ardından araçları sıralayabilirsiniz.

Listeyi oluşturup orta 25 gözlem alırsanız , 25/27 % 92,6 güven aralığı [0,9400, 0,9733] vardır. Güveni 26/27 % 96,3'e yükseltmek istiyorsanız, iki adet tek taraflı aralık seçeneğiniz vardır. Ya [0.9400, 0.9733] ya da [0.94, 0.99].26 / 27 =25/27=26/27=

Ben senin varsayalım size değiştirme ile yeniden örneklemek böylece, 3 den çok daha büyük olacaktır. Bunu 1000 kez yaptığınızı varsayalım. Sonra her durumda ortalamayı bulun. 1000 ortalama kümesinden orta 950 değerlerini alın. Bu alt kümenin en düşük ve en yüksek değerleri% 95 güven aralığını oluşturur.n

Buradaki soru: Bir permütasyon testinin parametresi için nasıl bir güven aralığı oluştururuz? bazı R kodları dahil daha fazla ayrıntı verir.


Başka bir yorumda yazıldığı gibi, n "3'ten çok daha büyük" olmayacaktır, ancak gerekirse n = 10 mümkündür. Bu yaklaşım güven aralığımın 1.0'ın ötesine geçmeyeceğini garanti etse de, diğer yöntemlerle verilen güven aralığını önemli ölçüde hafife alıyor gibi görünüyor. Aslında, asla [min, maks] aralıktan daha büyük olmayacaktır.
koalo

Ortalamanın ne kadar sıklıkla [min, maks] dışında olacağını düşünüyorsunuz?
soakley

Muhtemelen nadiren, ama bu aynı zamanda eğer [min, maks] aralık iddialarımı destekleyecek kadar küçükse, güven aralığını unutabilir ve sadece [min, max] sağlayabilir miyim? Deneyimlerime göre, küçük örnek boyutları için güven aralığı [min, maks] ile karşılaştırıldığında oldukça büyüktür.
koalo

2

Binom güven aralıkları uzun zamandır istatistik tartışmalarına konu olmuştur. Sorununuz% 100'den daha az bir oran olarak kabul edilir, ancak% 100 kullanırsak daha da sorunlu hale gelir. Soruyu sormanın içgörüsel bir yolu:

Son 2000 yıl boyunca güneşin her gün hatasız olarak yükseldiği göz önüne alındığında, yarın yükselme olasılığı nedir?

p=1

Bu kuyrukları hesaplamak için bir dizi yöntem vardır. Ben kontrol öneriyoruz Wikipedia matematik, yoksa sadece cevap istiyorsanız, böyle bir binom aralık hesap makinesi araması bu bir (aynı zamanda bunun arkasında matematik biraz daha açıklama var olur).


Bu aradığım şeye çok yakın, ancak formüller sadece denememin tek bir çalışmasının sonucu için güven aralığını hesaplıyor gibi görünüyor, birkaç deneyin ortalaması için bir güven aralığı değil.
koalo

Payda (örnekte 100 paket) tüm çalışmalarda aynı kaldığı sürece bir veya birkaç koşunuz olması önemli değildir. Her biri 100'lük 3 deneyi çalıştırmak, matematiksel olarak 300 paketle bir deneyi çalıştırmakla aynıdır ve binom formüllerini kullanabilirsiniz, ancak n = 100 ile değil, n = 300 ile. Paydalar eşit değilse, ağırlıklı ortalamayı (n'ler tarafından tartılır) bulmanız gerekir ve yeni n, n'lerin toplamı olacaktır.
Zahava Kor

@ZahavaKor Yorum yapmak için çok uzun olduğu için soruma bir düzenleme ekledim. Yanlış olduğunu söylemiyorum ama şu anki anlayışımla uyuşmuyor.
koalo

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.