Ya “.632 Kuralı” nda olasılıklar eşit değilse?


11

Bu soru bundan ".632 Kuralı" hakkında türetilmiştir . Konuları basitleştirdiği ölçüde user603'ün cevabına / notasyonuna özel referansla yazıyorum.

Bu cevap boyutu bir örnek ile başlar den, değiştirme ile toplama belirgin öğeleri (çağrı), bu N olasılığı örnek katman özel bir elemanın farklıdır N daha sonran i t h s i m ( 1 - 1 / n ) .n,nithsim(11/n).

Bu cevapta, N'nin tüm unsurları eşit olarak rasgele çizilme şansına sahiptir.

Benim sorum şudur: bunun yerine yukarıdaki soruda çizilecek öğelerin normal olarak dağıtılacakları olduğunu varsayalım. Biz de standart normal bir eğri alt bölümlere, bir için (örneğin) 100 eşit uzunlukta alt aralıklara içine. N'deki 100 öğenin her biri, ilgili aralığındaki eğrinin uyguladığı alana eşit olan bir çizilme olasılığına sahiptir.Z=4Z=4

Düşüncem şöyle oldu:

Akıl yürütme, sanırım bağlantılı cevaptaki ile benzerdir. , bir N elemanı ile olasılığı olup, burada , çizimsimmP(sim)=(1Fi)Fisi.

Belirli bir m elemanının n boyutundaki S numunesinde olma olasılığı,

= 1 - n 1 ( 1 - F i ) .

P(mS)=1P(mS)=11nP(sim)
=11n(1Fi).

Bir hesaplama, alt aralıkların uzunluğu , ilk durumda olduğu gibi aynı sayıya yaklaştığını göstermektedir ( olasılıkları eşittir).si

Bu bana mantıklı gelmiyor çünkü inşaat N'nin nadir bulunan elemanlarına atıyor gibi görünüyor, bu yüzden .632'den daha küçük bir sayı bekliyorum.

Ayrıca, eğer bu doğruysa, sanırım

limn1n(1Fi)=lim(11/n)n=1/e,

ki henüz doğru ya da yanlış olduğunu bilmiyorum.

Düzenleme: Doğruysa, muhtemelen bazı genelleştirecektir.

Görüşleriniz için teşekkürler.


Mathematics SE'deki son denklemi sordum (soru 791114), çünkü eğer nasıl olursa olsun, nasıl genelleştirildiğiyle de ilgileniyorum.
daniel

... ve kısa yanıt, son eşitliğin iyi davranılmış PDF'ler için doğru olmasıdır, bu nedenle sorunun cevabı .632 kuralının çok çeşitli temel dağılımlar için geçerli olmasıdır.
daniel

Başkasının cevabını başka bir siteden kaldırabilir ve buraya benimki olarak gönderebilir miyim? Bu yüzden kısa yorum gönderdim. Belki bunu kabul etmenin bir yolu var, eğer öyleyse uygunum.
daniel

Tabii ki, sadece bir noktada kaynak söz :)
Firebug

@Firebug: Ne demek istediğini görebilmek için bunun yapıldığı bir örneği gösterebilir misin? Teşekkürler.
daniel

Yanıtlar:


2

Soru, aşağıdakilerin sınırlayıcı davranışını soruyor:

(1)=1i=1n(1Fi)

olarak büyür ve eşit (a) tüm bunlar birlik toplamı negatif olmayan ve (b) olduğu gibi bir şekilde daralmaktadır. (Bunlar ve olasılık aksiyomlarından gelir.)F i F inFi Fi

Tanım olarak, bu ürün logaritmasının üstelidir:

i=1n(1Fi)=exp(i=1nlog(1Fi)).

(Geri kalan Lagrange formu) Taylor teoremi tatbik , kurar bulog

log(1Fi)=Fi12ϕi2Fi12Fi2

aralığında bazı için . Başka bir deyişle, bu logaritmalar en fazla kat olan terimlere eşittir . Ancak , tüm ( düzgün büzülmesiyle sağlanan bir ) ' dan daha küçük olmasını sağlayacak kadar büyük olduğunda , (b) anlamına gelir ve bu nedenleϕi[0,Fi]Fi 1/2Fi2nFiϵ>0Finϵ>Fi=1

i=1nFi2i=1nϵ2<i=1n(1n)2=1n.

sonuç olarak

1=i=1nFii=1nlog(1Fi)i=1nFi121n=112n

yaklaşan iki dizi arasındaki logaritmayı sıkar . Yana süreklidir, ürün bu sınırın üstel yakınsar, . sonuç olarak1expi=1n(1Fi)exp(1)

limn(1i=1n(1Fi))=1exp(1)0.632,

QED .


Bu analize daha yakından bakmak, bu yaklaşımdaki hatanın (her zaman alt sınır olacaktır) boyutunun değerinden daha büyük olmadığını ortaya Örneğin, standart bir Normal dağılımın ve arasındaki dilime bölünmesi, modunun yakınında maksimum üretir ve burada bir dikdörtgenin alanına yaklaşık olarak eşittir, . Yukarıdaki sınır, formül in değerini, sınırlayıcı değerinin içinde olacağını belirler . Asıl hata daha az büyüklük sırasıdır,n=400-44 F ı 0exp(-1 / 2) / 500.012(1)0.0110,001041 f i 1

(exp((n/2)max(Fi2))1)exp(1).
n=40044Fi0exp(1/2)/500.012(1)0.0110.001041 . İşte içinde hesaplama var R(hiçbiri çünkü güvenebileceğimiz gerçekten küçük görecelidir ):fi1
f <- diff(pnorm(seq(-4, 4, length.out=401))) # The normal "slices".
f <- f / sum(f)                              # Make them sum to unity.
exp(-1) - prod(1 - f)                        # Compute the error.

Gerçekten de, 1 - prod(1-f)bir ise olup .1 - exp ( - 1 ) 0.6321206 0.63316151exp(1)0.6321206


2
Hata analizi bu cevabın çok yararlı bir yönüdür.
daniel
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.