Büyük olasılıkla ≠ düz önce Bayes
Olabilirlik fonksiyonu ve güven aralığı ile ilişkili, tekdüze bir dağılımı belirleyen bir öncekiyle oluşturulmuş bir Bayesian arka olasılık ile aynı değildir (kavram).
Bu cevabın 1. ve 2. bölümünde , olasılığın neden daha önce bir daireye dayanan Bayesian arka olasılığı olarak görülmemesi gerektiği tartışılmaktadır.
Bölüm 3'te güven aralığı ve güvenilir aralığın geniş ölçüde değiştiği bir örnek verilmiştir. Ayrıca, bu tutarsızlığın nasıl ortaya çıktığı da belirtiliyor.
1 Değişken dönüştürüldüğünde farklı davranışlar
Olasılıklar belirli bir şekilde dönüşüyor . Eğer fx(x) olasılık dağılım dağılımını biliyorsak , dönüşüm kuralına göre, x = χ ( ξ ) fonksiyonlarından herhangi biri tarafından tanımlanan ξ değişkeni için fξ(ξ) dağılımını da biliyoruz :ξx=χ(ξ)
fξ(ξ)=fx(χ(ξ))dχdξdξ
Bir değişkeni dönüştürürseniz, ortalama ve mod, dağıtım işlevindeki bu değişiklik nedeniyle değişebilir. Bu, x¯≠χ(ξ¯) ve xmaxf(x)≠χ(ξmaxf(ξ)) .
Olabilirlik fonksiyonu yok değil bu şekilde dönüşümü . Bu olabilirlik fonksiyonu ile arka olasılık arasındaki karşıtlıktır . Değişkenleri dönüştürdüğünüzde (en fazla) olabilirlik işlevi aynı kalır .
Lξ(ξ)=Lx(χ(ξ))
İlgili:
Önceki ev belirsizdir . Belirli bir istatistik biçimine bağlıdır.
Örneğin, X (örneğin, dağıtılmış homojendir U(0,1)) , o zaman X2 olduğu değil muntazam dağılmış değişkeni.
Olabilirlik işlevini ilişkilendirebileceğiniz tek bir daire yoktur . Eğer düz önceden tanımlayan zaman farklı X ya da bu gibi bir dönüştürülmüş değişkeni X2 . Büyük olasılıkla için bu bağımlılık yok değil var.
Olasılığın sınırları (güvenilirlik aralıkları) değişkeni dönüştürdüğünüzde farklı olacaktır (olabilirlik işlevleri için bu böyle değildir) . Örneğin, bazı parametre a ve monotonik bir dönüşüm f(a) (örneğin logaritma) için, eşdeğer olabilirlik aralıklarını
aminf(amin)<<af(a)<<amaxf(amax)
2 Farklı konsepti: güven aralıkları olan bağımsız önce gelen
Bir X değişkenini (bilinmeyen) θ parametresine sahip bir popülasyondan (örneğin, θ parametresi olan popülasyon ) bir süper popülasyondan (muhtemelen θ için değişken değerlere sahip) örneklendiğini varsayalım .
Kişi, orijinal θX değişkeni için bazı xi değerlerini gözlemlemeye dayanarak ne olabileceğini ortaya çıkarmaya çalışan ters bir ifade verebilir .X
- Bayesian yöntemleri bunu mümkün θ dağılımı için önceden bir dağıtım varsayarak yapar.θ
- Bu , önceki dağıtımdan bağımsız olan olasılık fonksiyonu ve güven aralığı ile çelişir .
Güven aralığı yok değil yapar (güven bir olasılık değildir) inandırıcı aralık gibi bir önceki bilgisini kullanırlar.
Önceden dağıtılmasından bağımsız olarak (homojen olsun olmasın) % x güven aralığı , vakaların x değerinde gerçek parametreyi içerecektir (güven aralıkları, belirli bir durumda değil, yöntemin başarı oranına, tip I hatasını ifade eder).
Güvenilir aralık söz konusu olduğunda bu kavram (aralığının gerçek parametresi var o zaman) bile geçerli değildir, ama biz frequentist anlamda tefsir edebilir ve sonra biz güvenilir aralık tek gerçek parametreyi içerecek gözlemlemek ait x (üniforma) öncesinde doğru olduğunda zamanın Karşılaşabileceğimiz parametrelerin süper popülasyonunu tanımlamak. Aralık etkili bir şekilde% x'den daha yüksek veya daha düşük performans gösteriyor olabilir (Bayesian yaklaşımı farklı soruları yanıtladığından bu önemli değil, sadece farkı belirtmek gerekir).
3 Güven ve güvenilir aralıklar arasındaki fark
λx¯n
L(λ,x¯,n)=nn(n−1)!xn−1λne−λnx¯
nλx¯x¯+dx
not: oran parametresi λ den gider 0 için ∞ (OP 'isteğinin aksine 0 için 1). Bu durumda bir önceki bir uygunsuz olacaktır . Ancak ilkeler değişmez. Daha kolay gösterim için bu perspektifi kullanıyorum. Parametreler arasında dağılımlar0 ve 1 genellikle kesikli dağılımlar (sürekli çizgiler çizmek zor) veya bir beta dağılım (hesaplamak zor)
Aşağıdaki resim örnekleme boyutu için bu olasılık fonksiyonunu (mavi renkli harita) göstermektedir. n = 4, and also draws the boundaries for the 95% intervals (both confidence and credible).
The boundaries are created obtaining the (one-dimensional) cumulative distribution function. But, this integration/cumulation can be done in two directions.
The difference between the intervals occurs because the 5% area's are made in different ways.
The 95% confidence interval contains values λ for which the observed value x¯ would occur at least in 95% of the cases. In this way. whatever the value λ, we would only make a wrong judgement in 95% of the cases.
For any λ you have north and south of the boundaries (changing x¯) 2.5% of the weight of the likelihood function.
The 95% credible interval contains values λ which are most likely to cause the observed value x¯ (given a flat prior).
Even when the observed result x¯ is less than 5% likely for a given λ, the particular λ may be inside the credible interval. In the particular example higher values of λ are 'preferred' for the credible interval.
For any x¯ you have west and east of the boundaries (changing λ) 2.5% of the weight of the likelihood function.
A case where confidence interval and credible interval (based on improper prior) coincide is for estimating the mean of a Gaussian distributed variable (the distribution is illustrated here: https://stats.stackexchange.com/a/351333/164061 ).
An obvious case where confidence interval and credible interval do not coincide is illustrated here (https://stats.stackexchange.com/a/369909/164061). The confidence interval for this case may have one or even both of the (upper/lower) bounds at infinity.