Tahmin ve Tolerans Aralıkları


11

Tahmin ve hoşgörü aralıklarıyla ilgili birkaç sorum var.

Önce tolerans aralıklarının tanımlanması üzerinde anlaşalım: Bize bir güven seviyesi, örneğin% 90, yakalanacak nüfusun yüzdesi,% 99 ve örnek büyüklüğü, 20 diyelim. Olasılık dağılımı biliniyor, normal diyoruz kolaylık sağlamak için. Şimdi, yukarıdaki üç sayı (% 90,% 99 ve 20) ve altta yatan dağılımın normal olması nedeniyle, tolerans sayısını hesaplayabiliriz . Ortalama ve standart sapması olan bir örnek verildiğinde, tolerans aralığı . Bu tolerans aralığı popülasyonun% 99'unu örnek başarılı olarak adlandırılırk(x1,x2,,x20)x¯sx¯±ks(x1,x2,,x20)ve şart, numunelerin% 90'ının başarılı olmasıdır .

Yorum:% 90, bir numunenin başarılı olması için a priori olasılıktır. % 99, örneğin bir başarı olduğu göz önüne alındığında, gelecekteki bir gözlemin tolerans aralığında olması için şartlı olasılıktır.

Sorularım: Tahmin aralıklarını tolerans aralıkları olarak görebilir miyiz? Web'e baktığımda bu konuda çelişkili cevaplar aldım, hiç kimsenin tahmin aralıklarını dikkatli bir şekilde tanımlamadığını söylemiyorum. Öyleyse, tahmin aralığının (veya referansın) kesin bir tanımına sahipseniz, bunu takdir ediyorum.

Anladığım kadarıyla, örneğin% 99 tahmin aralığı, tüm numuneler için gelecekteki tüm değerlerin% 99'unu yakalamıyor . Bu,% 100 olasılıkla nüfusun% 99'unu yakalayan bir tolerans aralığıyla aynı olacaktır.

Bir% 90 tahmini aralığı için bulunan tanımlarında,% 90 , a priori örnek, mesela belirli bir olasılık (boyut sabitlenmiştir) ve tek bir gelecek gözlem , bu , tahmin aralığında olacaktır. Dolayısıyla, hem örnek hem de gelecekteki değerin, aynı zamanda, örneğin verildiği tolerans aralığının aksine ve belirli bir olasılıkla bir başarı olduğu ve örneğin bir başarı(x1,x2,,x20)yy, gelecekteki bir değer verilir ve belirli bir olasılıkla tolerans aralığına düşer. Tahmin aralığının yukarıdaki tanımının doğru olup olmadığından emin değilim, ancak en azından mantıksız görünüyor.

Herhangi bir yardım?


4
Normal bir örnekleme için tek taraflı tolerans aralıkları bu kavramın anlaşılmasına yardımcı olabilir. Üst % tolerans sınırı, modelin varsayılan dağılımının % 99 derecesinin üst güven sınırından başka bir şey değildir . Bu nedenle normal bir dağılım halinde bu parametrenin bağlanan bir üst güven μ + k σ burada k = z 99 % olan 99 % , standart Gauss dağılımının. 99%99%μ+kσk=z99%99%
Stéphane Laurent

Hemen Şekil tolerans sınırları bir çok türü vardır, çünkü bu, Stephane iyi biçimde yeniden formüle: örneğin bir sormak için üst ilgili güven sınırı a, düşük güven sınırı μ + z 0.99 σ (veya elde örneğin) bu parametrenin tarafsız bir tahmini . Üçüne de literatürde "tolerans sınırları" denir. μ+z0.99σμ+z0.99σ
whuber

Sanırım daha düşük bir güven limiti söylemek istediniz ? μz0.99σ
Stéphane Laurent

2
Aslında hayır, Stéphane (bu yüzden parametre için formülü tekrarlamaya özen gösterdim). Daha düşük bir tolerans limiti için de üç benzer tanım vardır . Örneğin, biz isteyebilirsiniz altında nüfusun yüzde birlik -estimate üst 99., ama bizim Hafifsemek hala çok yüksek olacağı söz konusu (diyelim)% 5 şans ısrar küçümsenmesi miktarını kontrol etmek. Bu, "Veriler,% 95 güvenle, nüfusun 99. persentilinin böyle ve böyle bir değeri aştığını gösteriyor."
whuber

Yanıtlar:


14

Tanımlarınız doğru görünüyor.

Bu konularda danışılması gereken kitap, İstatistiksel Aralıklardır (Gerald Hahn ve William Meeker), 1991.

Tek bir gelecekteki gözlem için tahmin aralığı, belirli bir güven derecesi ile, bir popülasyondan bir sonraki (veya önceden belirlenmiş başka bir şekilde) rastgele seçilen gözlemi içerecek bir aralıktır.

[A] tolerans aralığı, belirli bir güven derecesine sahip nüfusun en az belirli bir oranını, p , % içerdiğini iddia edebileceği bir aralıktır .100(1α)%

İşte standart matematiksel terminolojideki düzeltmeler. Let veri bağımsız rastgele değişken bir gerçekleştirme düşünülebilir X = ( X 1 , ... , x , n ) ortak kümülatif dağılım fonksiyonu F θ . ( Θ hatırlatmak olarak görünür F bilinmeyen olabilir ama dağılımları kümesi verilen içinde yalan varsayılır F İçeride ISTV melerin RWMAIWi'nin | θ İçeride ISTV melerin RWMAIWi'nin ). Let X 0x=(x1,,xn)X=(X1,,Xn)FθθFFθ|θΘX0aynı dağılım with değerine sahip ve ilk n değişkeninden bağımsız başka bir rastgele değişken olabilir.Fθn

  1. Bir kestirim aralığı uç noktalar tarafından verilen (tek bir gelecek gözlem), , belirleyici özelliği bu olan[l(x),u(x)]

    infθ{Prθ(X0[l(X),u(X)])}=100(1α)%.

    Spesifik olarak , F θ yasası ile belirlenen ( X 0 , X 1 , , X n ) n + 1 değişken dağılımına karşılık gelir . Koşullu olasılıkların olmadığına dikkat edin: bu tam bir ortak olasılıktır. Ayrıca, zamansal bir diziye herhangi bir referansın bulunmadığına dikkat edin: X 0 , diğer değerlerden önce zaman içinde çok iyi gözlenebilir . Farketmez.Prθn+1(X0,X1,,Xn)FθX0

    Bunun hangi yön (ler) in "sezgisel" olabileceğinden emin değilim. Veri toplamadan önce izlenecek bir faaliyet olarak istatistiksel bir prosedür seçmeyi düşünürsek , bu planlı iki adımlı bir sürecin doğal ve makul bir formülüdür, çünkü her iki veri ( ) ve "gelecekteki değer" X 0'ın rastgele modellenmesi gerekir.Xi,i=1,,nX0

  2. Bir tolerans aralığı, uç noktalar tarafından verilen , belirleyici özelliği bu olan(L(x),U(x)]

    infθ{Prθ(Fθ(U(X))Fθ(L(X))p)}=100(1α)%.

    atıfta bulunulmadığına dikkat edin : hiçbir rol oynamaz.X0

Ne zaman Normal dağılımların kümesidir, formun tahmin aralıkları vardır mevcut{Fθ}

l(x)=x¯k(α,n)s,u(x)=x¯+k(α,n)s

( örnek ortalaması ve s örnek standart sapmasıdır). Hahn & Meeker tarafından tablolanan k fonksiyonunun değerleri x verilerine bağlı değildir . Normal durumda bile başka tahmin aralığı prosedürleri vardır : bunlar sadece bunlar değildir.x¯skx

Benzer şekilde, formun tolerans aralıkları vardır

L(x)=x¯K(α,n,p)s,U(x)=x¯+K(α,n,p)s.

Başka tolerans aralığı prosedürleri de vardır : bunlar sadece bunlar değildir.

Bu formül çiftleri arasındaki benzerliğe dikkat ederek, denklemi çözebiliriz.

k(α,n)=K(α,n,p).

αpααp


2
Bu aralıklar arasındaki karışıklık gerçektir. On yıl önce, bir devlet istatistikçisiyle, farkı bilmeyen ve (küstahça) bir tanesini tanıyamayan birtakım zor konuşmalar yaptım. Rehberlik oluşturma, raporları gözden geçirme, vaka çalışanlarına tavsiyelerde bulunma, yazılım dağıtma ve hatta hakemli yayınlar konusundaki önemli rolü, bu kavram yanılgılarının devamını desteklemiştir. Bu yüzden sakının!
whuber

p=50%k(α,n)=K(α,n,0.5)

3
np=50%X0

k(α,n)K(50%,n,1α)nK50%z1α/n

@whuber. Cevap için teşekkür ederim. Doğru işaretlemeden önce anladığımdan emin olmalıyım. Bana "sindirmek" için biraz zaman tanıyın.
Ioannis Souldatos

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.