Tekdüze bir dağılım parametresini tahmin etmek: uygun değil mi?


10

N örneğimiz var, Xi, düzgün bir dağılımdan [0,θ] nerede θbilinmeyen. Tahminθ verilerden.

Bayes kuralı ...

f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)

ve olasılık:

f(Xi|θ)=i=1N1θ (değiştir: ne zaman 0Xiθ hepsi için i, ve başka türlü 0 - teşekkürler whuber)

ama hakkında başka bilgi olmadan θ, öncekilerle orantılı olmalı 1 (yani tek tip) veya 1L (Jeffreys önceden mi?) [0,]ama sonra integrallerim birleşmiyor ve nasıl ilerleyeceğimden emin değilim. Herhangi bir fikir?


2
Olasılık yanlış: her seferinde sıfır olacak θ en büyükten daha az Xi.
whuber

Hangi integralleri aldığınızı gösterebilir misiniz?

Evet, sanırım, daha önce uygunsuz olanla nasıl başa çıkacağımı bilmiyorum. Örneğin, yazmak istiyorumf[Xi]=Θf(Xi|θ)f(θ)dθ
Will

1
Önceden uygunsuz olanlar için, f[Xi]=Θf(Xi|θ)f(θ)dθ = max(Xi)θNdθ= ve benzer şekilde elde ettiğiniz önceki içinÇünkü hemen hemen kesin, bu kesin integraller yakınsar. max(Xi)1N/(N1)f(θ)1/θmax(Xi)N/N.maxXi>0
whuber

1
Bernardo referans posterioru Pareto'dur - bilgilendirici olmayan önceliklerin kataloğuna bakın .
Stéphane Laurent

Yanıtlar:


4

Bu ilginç bir tartışma yarattı, ancak bunun ilgi konusu üzerinde gerçekten fazla bir fark yaratmadığını unutmayın. Şahsen, bir ölçek parametresi olduğu için, dönüşüm grubu argümanının uygun olduğunu veθ

p(θ|I)=θ1log(UL)θ1L<θ<U

Bu dağılım, sorunun yeniden ölçeklendirilmesinde aynı forma sahiptir (yeniden ölçeklendirme altında da "değişmez" olarak kalır). Öncekinin çekirdeği, , fonksiyonel denklemini çözerek türetilebilir . değerleri soruna bağlıdır ve gerçekten sadece numune boyutu çok küçükse (1 veya 2 gibi) önemlidir. Posterior, kesilmiş bir paretodur:f(y)=y1af(ay)=f(y)L,U

p(θ|DI)=NθN1(L)NUNL<θ<UwhereL=max(L,X(N))
N. olduğu sipariş istatistiği veya numunenin maksimum değeri. Biz arka ortalamasını almak Eğer biz grubu ve daha basit anlatımı elde .X(N)
E(θ|DI)=N((L)1NU1N)(N1)((L)NUN)=NN1L(1[LU]N11[LU]N)
UL0E(θ|DI)=NN1X(N)

Ama şimdi tarafından verilen daha genel bir kullandığımızı varsayalım ( her şeyin doğru olduğundan emin olmak için sınırlarını koruduğumuzu unutmayın - tekil matematik yok ). Posterior daha sonra yukarıdakiyle aynıdır, ancak olması koşuluyla yerine - . Yukarıdaki hesaplamaları tekrarlayarak, basitleştirilmiş posterior ortalamap(θ|cI)θc1L,UNc+Nc+N0

E(θ|DI)=N+cN+c1X(N)

Bu nedenle, önceki ( ) üniform , (ortalama için sonsuz koşuluyla , . Bu, buradaki tartışmanın , varyans tahmininde bölen olarak veya kullanılıp kullanılmayacağına biraz benzediğini göstermektedir .c=1N1N2X(N)N2N=2NN1

Bu durumda daha önce düzgün olmayan üniforma kullanılmasına karşı bir argüman, posteriorun olduğunda , ile orantılı olduğu için uygunsuz olmasıdır . Ancak bu sadece veya çok küçük olduğunda önemlidir .N=1θ1N=1


1

Burada amaç bazı geçerli ve yararlı tahminini elde etmek muhtemelen olduğundan , önceki dağıtım tutarlı olmalıdır Numunenin geldiği nüfus dağılımı şartnameye. Bu hiçbir şekilde numunenin kendisini kullanmadan önce "hesapladığımız" anlamına gelmez-bu, tüm prosedürün geçerliliğini geçersiz kılar. Numunenin geldiği popülasyonun, her biri aralığında değişen tek tip rasgele değişkenlerin bir popülasyonu olduğunu biliyoruz . Bu, sürdürülen bir varsayımdır ve sahip olduğumuz önceki bilgilerin bir parçasıdır (ve örnekle , yani bu rastgele değişkenlerin bir alt kümesinin spesifik bir şekilde gerçekleştirilmesiyle hiçbir ilgisi yoktur ).θ[0,θ]

Şimdi bu popülasyonun rasgele değişkenlerden oluştuğunu varsayın (örneğimiz rasgele değişkenin gerçekleşmesinden oluşuyor ). varsayım bize mn<mn

maxi=1,...,n{Xi}maxj=1,...,m{Xj}θ

Kompaktlık için ifade . Sonra de yazılabilir maxi=1,...,n{Xi}XθX

θ=cXc1

Yoğunluğu fonksiyonu arasında Düzgün RV kadar IID olduğu maxN[0,θ]

fX(x)=N(x)N1θN

destek , ve başka bir yerde sıfır. Daha sonra kullanarak ve değişken değişikliği formülünü uygulayarak için sürdürülen varsayımla tutarlı bir önceki dağıtım elde ederiz : [0,θ]θ=cXθ

fp(θ)=N(θc)N1θN1c=NcNθ1θ[x,]

sabit uygun şekilde belirtmezsek bu durum uygunsuz olabilir . Ancak için uygun bir posteriora sahip olmaktır ve ayrıca olası değerlerini kısıtlamak istemiyoruz (sürdürülen varsayımın ima ettiği kısıtlamanın ötesinde). Bu yüzden belirsiz bırakıyoruz . Sonra arkayacθθc
X={x1,..,xn}

f(θX)θNNcNθ1f(θX)=ANcNθ(N+1)

bazı normalleştirici sabitler için A

Sθf(θX)dθ=1xANcNθ(N+1)dθ=1

ANcN1NθN|x=1A=(cx)N

Posterior

f(θX)=(cx)NNcNθ(N+1)=N(x)Nθ(N+1)

Önceki dağılımın belirlenmemiş sabiti uygun şekilde iptal edildiğine dikkat edin.c

Posterior, belirli numunenin değeri ile ilgili bize verebileceği tüm bilgileri özetler . için belirli bir değer elde etmek istiyorsak posteriorun beklenen değerini kolayca hesaplayabiliriz, θθ

E(θX)=xθN(x)Nθ(N+1)dθ=NN1(x)NθN+1|x=NN1x

Bu sonuçta herhangi bir sezgi var mı? Eh, sayısı olarak 'in arttıkça, daha büyük olasılıkla aralarında maksimum gerçekleşme yaklaştıkça üst bağlanmış, olacak olmasıdır arka ortalama değer tam olarak ne olduğu - eğer söz hakkından: yansıtır , , ancak . Bu, önceki seçim ile ilgili taktiğimizin eldeki problemle makul ve tutarlı olduğunu, ancak bir anlamda "optimal" olması gerekmediğini göstermektedir.XθθN=2E(θX)=2xN=10E(θX)=109x


1
Önceki verilere dayandırmak kulağa balık gibi geliyor. Bu yaklaşımı nasıl haklı çıkarsınız?
whuber

2
Öncekinin "en iyi" olmadığı gerçeğine karşı hiçbir şeyim yok. Nerede böyle bir şey söyledim? Sadece yaklaşımınızı anlamaya çalışıyorum. Bu eşitliği henüz anlamıyorum. Eğer sabiti eşitliği içindedir , Bu ne anlama geliyor, her iki ve rastgele olmayan bir husustur? Bu arada siz yok kullanmak gerçeğini öncesinde çıkarımında, öyle mi? (cc @whuber)cθ=cXXθc1
Stéphane Laurent

1
Öncekinizin desteği verilere mi bağlı? ( )θ[x,[
Stéphane Laurent

3
Verilere önceden bağlı (bu sadece destek yoluyla olsa bile) yanlış geliyor: örnek üretilmeden önce numunenin maksimum miktarını bilemezsiniz . Ayrıca, iddia ile olan neredeyse emin eşitlik hem ve rasgele (böylece korelasyon ). Ancak bu, posterior dağılımının ( örnek verilen koşullu dağılımıdır ) deki Dirac kütlesi olduğu anlamına gelir . Bu da posterior dağılımı türetmenizle çelişir. ... (karakter kalmadı ...)θ=cXθX1θθcx
Stéphane Laurent

1
Arka dağılımı de Dirac olduğunu araçları is . Bayes teoremi bunun nedeni değildir. varsayarak her şeyi yok edersiniz . Bu ifade eder , bu nedenle verilen koşullu dağılımı Dirac kütlesidir , oysa asıl varsayım bu dağılımın . θcxθ cxθ=cXX=θ/cXθθ/c(0,θ)
Stéphane Laurent

0

Düzgün Önceki Dağıtım Teoremi (aralık durumu):

"Eğer ilgili Sizin bilgilerin toplamıdır veri harici tek önerme tarafından yakalanır o zaman Mantıksal olarak dahili olarak tutarlı önceki spesifikasyonunuz θD

B={{Possible values for θ}={the interval (a,b)},a<b}
f(θ)=Uniform(a,b)

Bu nedenle, yukarıdaki belirtime gerçekten inanıyorsanız, önceki spesifikasyonunuz Jeffrey öncekine karşılık gelmelidir. "

Tekdüze Önceki Dağıtım Teoreminin bir parçası değildir:

Alternatif olarak, önceki dağılımınızı , arka dağılımın konjugasite ile başka bir tekdüze dağılım olması gerektiğini bilerek, üniforma için konjugat dağılımı olan bir Pareto dağılımı olarak belirtebilirsiniz . Ancak, Pareto dağıtımını kullanıyorsanız, Pareto dağıtımının parametrelerini bir şekilde belirtmeniz gerekir.f(θ)


4
Önce "sadece mantıksal olarak içsel olarak tutarlı" cevabının tek tip bir dağılım olduğunu söylüyorsunuz ve daha sonra bir alternatif önermeye devam ediyorsunuz. Bu bana mantıksız ve tutarsız geliyor :-).
whuber

2
Kabul edemem. Örneğin, aynı zamanda PDF olan için . Ancak "teoremi" ne göre, o aralıkta olan . Kısacası, öneri sorunun nasıl parametreleştirildiğine bağlı olmasa da , "teorem" in sonucu belirsizliğe bağlı olarak parametrelendirmeye bağlıdır. B{θ|θ3(a3,b3)}.ΘUniform(a,b),Ψ=Θ31/(3ψ2/3(ba))a3<ψ<b3ΨUniform(a3,b3)1/(b3a3)
whuber

2
BabakP: Bunun teorem olduğunu nasıl söyleyebiliriz ? Bir teorem, matematiksel bir kanıtı olan matematiksel bir iddiadır. Bu "teorem" daha uygun bir şekilde "ilke" olarak adlandırılacaktır, ancak mantıklı değildir, çünkü @whuber tarafından gösterildiği gibi çelişkilidir.
Stéphane Laurent

2
Referans BabakP için teşekkürler. "Kanıt kroki" nin sahte olduğunu belirtmek isterim. Draper, aralığı sınırlı sayıda eşit aralıklı değere böler ve "sınıra geçer". Herkes aralığını istediği herhangi bir yoğunluğa yaklaşmak üzere aralıklı değerlere bölebilir ve benzer şekilde sınıra geçebilir ve mükemmel keyfi "yalnızca mantıksal olarak iç tutarlı tutarlı özellikler sağlar". Bu tür şeyler - yani, Bayesli olmayanların mantıksız olduğunu göstermek için kötü matematiği kullanmak - Bayesci analize (haklı olarak) kötü bir isim verir. (cc @ Stéphane.)
whuber

1
@ Stéphane Lütfen duyarsızlığımı affedin ( insensibilité ) - Burada ikinci bir dilde iletişim kurma yeteneğinize hayranım ve bilerek belirsiz terimler kullanmıyorum! Sahte , sahte para için bir makineye atıfta bulunan 200 yıllık bir ABD argo teriminden gelen bir sıfattır. Bu durumda sahtecilik teoremleri için bir matematik makinesi :-).
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.