Süreklilik düzeltmesi neden (binom dağılımına normal yaklaşım) diyor?


24

Normal yaklaşım için binom dağılımındaki süreklilik düzeltmesinin nasıl elde edildiğini daha iyi anlamak istiyorum .

1/2 eklememiz gerektiğine karar vermek için hangi yöntem kullanıldı (neden başka bir sayı değil?). Herhangi bir açıklama (veya önerilen okuma için bir bağlantı dışında bu , mutluluk duyacağız).

Yanıtlar:


29
  1. Aslında bu (her zaman herhangi normal tarafından binom cdf yakınlaştırılması iyileştirilmesi anlamında "iş" her zaman değil ). Binom 0,5 ise, belki de en aşırı kuyruk hariç her zaman yardımcı olduğunu düşünüyorum. Eğer çok uzakta 0,5 ila için oldukça büyük değildir genellikle uzak kuyruk hariç çok iyi çalışır, ancak eğer yakındır 0 veya 1 o hiç değil yardım (aşağıdaki 6. bakınız) olabilirp p n pxppnp

  2. Akılda tutulması gereken bir şey (neredeyse her zaman pmfs ve pdfs içeren resimlere rağmen), yaklaşık olarak çalıştığımız şeyin cdf olmasıdır. Binomun cdf'sine ve yaklaşık normaline neyin olup bittiğini düşünmek faydalı olabilir (örneğin, burada ):n=20,p=0.5

    görüntü tanımını buraya girin

    Sınırda standartlaştırılmış bir binomun cdf'si standart bir normale gidecektir (standardizasyonun x eksenindeki ölçeği etkilediğini ancak y eksenini etkilemediğine dikkat edin); giderek daha büyük için yol boyunca binom CDF en atlamaları daha eşit, normal cdf apışıp eğilimindedir.n

    Yakınlaşalım ve yukarıdaki basit örnekte buna bakalım:

    görüntü tanımını buraya girin

    Yaklaşan normalin dikey sıçramaların * ortasına yakın geçtiğinden, limitte normal cdf'nin lokal olarak yaklaşık olarak doğrusal olduğuna ve (her atlamanın tepesindeki binom cdf'in ilerlemesi gibi) olduğuna dikkat edin; Sonuç olarak cdf, yakınındaki yatay basamakları geçme eğilimindedir . Eğer binom CDF, değerini yaklaşık için tamsayıdır de yakın, bu normal CDF ulaştığı yükseklik . F(x)xx+1x+12F(x)xx+12

    * Berry-Esseen'i ortalama düzeltilmiş Bernoulli değişkenlerine uygularsak, Berry-Esseen sınırları, ve yakınında olduğunda çok az kıpırdatma odasına izin verir - normal , makul bir şekilde orada atlar çünkü aksi takdirde cdfs'deki mutlak fark, bir tarafa ya da diğerine bağlanan en iyi Berry-Essen'i geçecektir. Bu da 'dan normal cdf' nin binom cdf 'nin step fonksiyonunun yatay kısmını ne kadar uzağa geçebileceği ile ilgilidir.1p xμx+112xμx+12

  3. 1'deki oluşturmak için binom cdf' ye normal bir yaklaşımı nasıl kullanacağımızı düşünelim . Örneğin, (yukarıdaki ikinci şemaya bakınız). Bu yüzden normal ve sd ile normal olan . Normal cdf'deki değişim yaklaşık 8,5 ile 9,5 arasında değiştiği için cdf'deki atlamayı 9'da hesaplayacağımızı unutmayın.n = 20 , p = 0.5 , k = 9 N ( 10 , ( P(X=k)n=20,p=0.5,k=9N-(10,(5)2)

görüntü tanımını buraya girin

  1. Aynı şeyi daha az resmi ama daha "normal" ders kitabı motivasyonu altında yaparak (belki de daha yeni başlayanlar için daha sezgiseldir), sürekli bir değişkenle ayrık bir değişkene yaklaşmaya çalışıyoruz. Bu yükseklik, her olasılık başak değiştirerek binom sürekli bir versiyonunu yapabilir 'de merkezlenmiş 1 genişliği bir dikdörtgen tarafından o yükseklik veren (mavi dikdörtgen aşağıya bakınız; her x- için bir hayal değer) ve sonra, normal binar cinsinden, orjinal binom ile aynı ortalama ve sd değerleriyle yaklaşık olarak:x p ( x )p(x)xp(x)

    ! [buraya görüntü açıklamasını girin

    Kutunun altındaki alana, ve arasındaki normal değer ; Yatay basamakların üstünde ve altında bulunan neredeyse üçgen biçimli iki alan birbirine yakındır. Bir aralıktaki bazı binom olasılıkları toplamı, bu yaklaşımların toplanmasına indirgenecektir. (Bunun gibi bir şema çizmek, belirli bir hesaplama için 0,5 yukarı ya da aşağı gitmeniz gerekip gerekmediği hemen belli değilse, çok yararlıdır ... hesaplamada hangi binom değerlerini istediğinizi hesaplayın ve her iki taraf için her biri.)x-12x+1212

    Normal yaklaşımı türetmek için (De Moivre'nin yaklaşımından biraz daha doğrudan gerçekleştirilebilse de) kişi, bu yaklaşımı cebirsel olarak [De Moivre çizgileri boyunca - örneğin buraya veya buraya bakınız ] türetmek suretiyle motive edebilir.

    Bu esasen, teriminde Stirling'in yaklaşımını kullanmak ve bunu elde etmek için bu kullanmak da dahil olmak üzere birkaç yaklaşımla ilerler .(nx)günlük(1+x)x-x2/2

    P(X=x)12πnp(1-p)exp(-(x-np)22np(1-p))

    ortalama ile normal yoğunluğu söylemek olan ve varyans de yaklaşık olarak en binom PMF yüksekliğidir . Esasen De Moivre'nin yapması gereken yer burası.μ=npσ2=np(1-p)xx

    Bu yüzden şimdi normal alanlar için binom yükseklikleri cinsinden orta nokta-kural yaklaşımına sahip olduğumuzu düşünün ... yani , orta nokta kuralının ve De . Buna saygısızlık etmek, .Y~N-(np,np(1-p))F(y+12)-F(y-12)=y-12y+12fY(u)dufY(y)fY(x)P(X=x)P(X=x)F(x+12)-F(x-12)

    [Benzer bir "orta nokta kuralı" türü yaklaşımı, süreklilik düzeltmesi kullanarak yoğunluğa göre sürekli pmfs'nin bu gibi diğer yaklaşımlarını motive etmek için kullanılabilir, ancak bu yaklaşımı çağırmanın ne kadar mantıklı olduğuna dikkat etmek için her zaman dikkatli olunmalıdır]

  2. Tarihsel not: Süreklilik düzeltmesi, De Moivre'nin yaklaşımının bir gelişimi olarak 1838'de Augustus de Morgan ile ortaya çıkmış görünüyor. Bakınız, örneğin Hald (2007) [1]. Hald'in açıklamasından dolayı, mantığı, yukarıdaki 4. maddenin çizgileri boyuncadı (temel olarak, x-değerinde merkezlenmiş bir genişlik "1 bloku" ile başak olasılığını değiştirerek pmf'yi yaklaştırmaya çalışmak açısından).

  3. Süreklilik düzeltmesinin işe yaramadığı bir durumun bir örneği:

    görüntü tanımını buraya girin

    Soldaki grafikte (daha önce olduğu gibi, binom, normal yaklaşımdır), ve böylece . Sağdaki arsada (aynı binom ancak kuyruğa daha da eklenir), ve böylece - Süreklilik düzeltmesini dikkate almamak, bu bölgede kullanmaktan daha iyidir.XYFX(x)FY(x+12)p(x)FY(x+12)-FY(x-12)FX(x)FY(x)p(x)FY(x)-FY(x-1)

    [1]: Hald, Anders (2007),
    "Bernoulli'den Fisher'a Parametrik İstatistiksel Çıkarımın
    Tarihi , 1713-1935", Matematiksel ve Fizik Bilimler Tarihindeki Kaynaklar ve Çalışmalar,
    Springer-Verlag New York


1

Faktörün sürekli bir dağılımı bir kesikli ile karşılaştırmamızdan kaynaklandığını düşünüyorum. Bu nedenle sürekli dağılımda her bir ayrık değerin ne anlama geldiğini tercüme etmemiz gerekir. Başka bir değer seçebilirdik, ancak bu verilen bir tamsayı için dengesiz olurdu. (yani, 6'da 7'ye, 5'ten 7'ye kadar olma olasılığını ağırlıklandıracaksınız.)

Burada yararlı bir link buldum: link

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.