Olabilirlik konusundaki Wikipedia yazısı belirsiz görünüyor


26

"Koşullu olasılık" ve "Olabilirlik" ile ilgili basit bir sorum var. (Bu soruyu burada zaten araştırdım ancak boşuna yok.)

Olasılıkla ilgili Wikipedia sayfasından başlar . Bunu söylüyorlar:

Olabilirlik parametre değerlerinin bir dizi, , sonuçlar verilen , olduğu bileşiklerdir parametre değerleri verilenlerden gözlenen sonuçların olasılık, eşittirθx

L(θx)=P(xθ)

Harika! Bu yüzden İngilizce olarak şunu okudum: "Verileri X = x, (sol taraftaki) verilen, tata eşitleme olasılığı , parametrelerin verilmiş olması durumunda , X verilerinin x'e eşit olma olasılığına eşittir. teta'ya eşittir ". ( Kalın vurgu için benimdir ).

Ancak, aynı sayfada en az 3 satır sonra, Wikipedia girdisi şöyle devam eder:

Parametre bağlı olarak ayrık olasılık dağılımlı ile rastgele bir değişken olmasına izin verin . Sonra işlevXpθ

L(θx)=pθ(x)=Pθ(X=x),

bir fonksiyonu olarak kabul edilir , olasılık fonksiyonu ( rasgele değişkeninin sonucunu verilen) verilen fonksiyonu olarak adlandırılır . Bazen değeri olasılığı ve parametre değeri olarak yazılır ; bunun genellikle koşullu bir olasılık olmayan ' den farklı olduğunu vurgulamak için olarak yazılır , çünkü bir parametredir ve rastgele bir değişken değildir.θθxXxXθP(X=xθ)P(X=x;θ)L(θx)θ

( Kalın vurgu için benimdir ). Bu yüzden, ilk alıntıda, kelimenin tam anlamıyla koşullu bir olasılıktan bahsediyoruz , ancak hemen sonra, bunun aslında koşullu bir olasılık OLMADIĞINI ve aslında ?P(xθ)P(X=x;θ)

Peki hangisi? Olabilirlik aslında ilk teklifin alabileceği koşullu bir olasılığı ifade ediyor mu? Yoksa ikinci teklifin alabileceği basit bir olasılık mı?

DÜZENLE:

Şimdiye kadar aldığım tüm faydalı ve anlayışlı cevaplara dayanarak, sorumu ve şu ana kadarki anlayışımı özetledim:

  • In İngilizce "olabilirlik gözlenen verilerin VERİLEN, parametrelerin bir fonksiyonudur.": Biz demek Olarak matematik : biz olarak yazmak .L(Θ=θX=x)
  • Olasılık bir olasılık değildir.
  • Olasılık bir olasılık dağılımı değildir.
  • Olasılık bir olasılık kütlesi değildir.
  • Olasılığı olarak, ancak bir İngilizce "burada olasılık dağılımları bir ürünü, (sürekli durumda), veya olasılık kitlelerin bir ürünü, (ayrık durum), ve parametreli tarafından . " Olarak matematik , o zaman örneğin yazmak: ( bir PDF olduğu sürekli durum ) ve (ayrık durum, bir olasılık kütlesidir). Burada paket servisi olan restoran burada hiçbir noktada hiçbir şekildeΘ = θ L ( Θ = θ X = x ) = f ( X = x ; Θ = θ ) f L ( Θ = θ X = x ) = P ( X = x ; Θ = θ ) PX=xΘ=θL(Θ=θX=x)=f(X=x;Θ=θ)f
    L(Θ=θX=x)=P(X=x;Θ=θ)P hiç bir şarta bağlı koşullu olasılık.
  • Bayes teoreminde, biz var: . Sonuç olarak, " bir ihtimaldir" deniliyor, ancak, bu doğru değil , çünkü bir gerçek rastgele değişken. Bu nedenle, doğru söyleyebileceğimiz şey, bu teriminin bir olasılıkla "benzer" olmasıdır. (?) [Bu konuda emin değilim.] P(X=xΘ=θ)ΘP(X=xΘ=θ)P(Θ=θX=x)=P(X=xΘ=θ) P(Θ=θ)P(X=x)P(X=xΘ=θ)ΘP(X=xΘ=θ)

EDIT II:

@Amoebas'ın cevabına dayanarak son yorumunu yazdım. Bence oldukça aydınlatıcı ve bence sahip olduğum ana çekişmeyi temizliyor. (Resme yorumlar).

görüntü tanımını buraya girin

EDIT III:

@Amoebas'ın yorumlarını Bayesian davasına şimdi de genişlettim:

görüntü tanımını buraya girin


Zaten iki hoş cevabınız var ancak istatistikleri
Tim

@Tim Mükemmel bağlantı teşekkürler! Maalesef Olasılığa karşı sahip olduğum özel sorular ve aklıma gelen şartlı olasılık (?) Hakkında hala net değilim . Bu konuda hala belirsizim. : - /
Creatron

2
"Verilen" her zaman koşullu olasılık anlamına gelmez. Bazen bu kelime öbeği yalnızca bir hesaplamada veya kavramsal olarak hangi sembollerin sabitlenmesi gerektiğini gösterme çabasıdır.
whuber

2
Bazı insanlar gerçekten de bu tipografik bir sözleşmeyi noktalı virgülle kullanıyorlar. Pek çok, pek çok sözleşme var: abonelikler, üst yazılar, vb. Genellikle birinin bağlamdan veya ne yaptıklarının metin açıklamalarından ne anlama geldiğini bulmanız gerekir.
whuber

4
Ne zaman (olduğunu, kabul edilen değer rastgele değişkenin kaynaklandığı rastgele değişken olan ), olabilirlik değişikliklerin tanımında hiçbir şey. Hala bir ihtimal. Mantıksal olarak, bu mavi bir kelebeğin hala bir kelebek olduğunu söylemekten farklı değildir. Teknik olarak, ve ortak dağılımıyla ilgili sorunları gündeme getiriyor . Açıkçası, bu ortak dağıtım iyi tanımlanmış olmalı ve koşullu bir olasılık olasılığını tanımlayabilmeniz için önce belirli "düzenlilik koşullarından" faydalanmalıdır. Θ Θ xθΘΘx
whuber

Yanıtlar:


18

Bunun büyük ölçüde gereksiz bölünmüş kıllar olduğunu düşünüyorum.

Şartlı olasılık bir verilen , iki rasgele değişken için tanımlandığı ve değerleri alınarak ve . Ama aynı zamanda olasılık bahsedebiliriz ait verilen nerede değil rastgele değişken ama bir parametredir.x y X Y x y P ( x θ ) x θ θP(xy)P(X=xY=y)xyXYxyP(xθ)xθθ

Her iki durumda da aynı "verilen" terimin ve aynı notasyonun kullanılabileceğini unutmayın. Farklı notasyonlar icat etmeye gerek yoktur. Ayrıca, "parametre" olarak adlandırılan ve "rastgele değişken" olarak adlandırılan şey, felsefenize bağlı olabilir, ancak matematik değişmez.P()

Wikipedia'dan yapılan ilk alıntı, tanım gereği olduğunu belirtir . Burada bir parametre olduğu varsayılmaktadır . İkinci alıntı söylüyor olduğu değil bir koşullu olasılık. Bu, verilen bir koşullu bir olasılık olmadığı anlamına gelir ; ve gerçekten de olamaz, çünkü burada bir parametre olduğu kabul edilir.θ L ( θ x ) θ x θL(θx)=P(xθ)θL(θx)θxθ

Bayes teoremi bağlamında her ikisi de ve rasgele değişkenlerdir. Fakat yine de “ihtimal” ( ) denebilir , ve şimdi aynı zamanda iyi niyetli koşullu olasılık ( ). Bu terminoloji Bayesian istatistiklerinde standarttır. Kimse olasılığa "benzer" bir şey demiyor; insanlar basitçe buna ihtimal diyorlar.

P(ab)=P(ba)P(a)P(b),
abP(ba)ab

Not 1: Son paragrafta, açıkça şartlı bir olasılıktır . Bir olasılığı olarak bu bir fonksiyonu olarak görülmektedir ; ama ! 'nın olasılık dağılımı (veya koşullu olasılık) değildir ! Üzerinde Onun ayrılmaz mutlaka eşit değildir . (Oysa üzerindeki integrali vardır .)b L ( a | b ) bir a , bir 1 bP(ba)bL(ab)aaa1b

Not 2: Bazen olabilirlik, @MichaelLew'in vurguladığı gibi, rasgele bir orantılılık sabiti ile tanımlanır (çünkü çoğu zaman insanların olasılık oranları ile ilgilenir ). Bu yararlı olabilir, ancak her zaman yapılmaz ve şart değildir.


Ayrıca bakınız "Olasılık" ile "olasılık" arasındaki fark nedir? ve özellikle @ whuber'un cevabı orada.

@ Tim'in bu konudaki cevabı ile de tamamen aynı fikirdeyim (+1).


1
Yani bir olasılık, aslında, (son paragrafa göre) koşullu bir olasılıkla eşit olabilir , doğru mu? Ben kare yapmaya çalışıyorum budur. Örneğin, ilk cevaplardan birinde, şöyle bir şey var: " İlk olarak, olabilirlik, olasılıkla, yalnızca bir orantılılık sabitine kadar tanımlandığı için, parametre değeri verilen verinin olasılığına eşit olamaz . ilk biçimsel olasılık olabilir (Fisher, 1922). Olasılık - olasılık - hiç koşullu bir olasılığa eşit olabilir mi?
Creatron

@Creatron Cevabımı iki Not ekledim. Netleştiriyorlar mı?
amip diyor Reinstate Monica,

1
Not 1 ilgili olarak: yana olan bir koşullu olasılık dağılımı, ve o zamandan beri L ( a | b ) olamaz bir olasılık dağılımını olmak, o zaman en 'doğru' yolu biz denklemi yazabiliriz geliyor bana Bu bağlamda olabilirlik: L ( a | b ) P ( b | a ) ve L ( a | b ) = P ( b | a )P(b|a) L(a|b) L(a|b)P(b|a)L(a|b)=P(b|a). (Optimizasyonda bunun bir fark yaratmadığını biliyorum, ancak burada olasılığın doğruluğunu azaltmaya çalışıyorum). Benim anlayışım doğru mu? Sabrınız için teşekkürler.
Creatron

1
@Creatron Burada birkaç farklı konuyu karıştırdığınızı düşünüyorum. İkinizin de nerede, (benim Not 1 atıfta budur) bir Bayes teoremi ayarı bahsediyoruz farz ve b rastgele olaylardır. Pekala, P ( B | a ) bir şartlı olasılık dağılımıdır b verilen bir . Ama L ( a | b ) bir fonksiyonu olarak görülebilir gerekiyordu bir değil, b ! Ve bu olasılık dağılımı değil aabP(b|a)baL(a|b)abaçünkü bire bir değil. Bunun konuyla ya da orantılılıkla ilgisi yok (ki Not 2). Sanırım yazabiliriz . L(a|b)=P(b|a)
amip diyor Reinstate Monica

1
Amip, teşekkür ederim !! Benim için bu kavramları çözmede aracı oldun, çok teşekkür ederim !! :) Çizgiyi Bayesian vakasına "genişlettim" ve bunu doğru bir şekilde anladığımdan emin olmak için geri bildiriminiz için teşekkür ederim. Ben de cevabını kabul ettim. Bir kez daha, kitlesel zarif!
Creatron

10

Zaten iki güzel cevabın var, ama hala belirsiz gözüktüğünden bir tane vermeme izin ver. Olabilirlik olarak tanımlanır

L(θ|X)=P(X|θ)=ifθ(xi)

bu yüzden sahip olasılığını bir parametre değeri verilen veri x . Bu olasılık (ayrık durum) ya da yoğunluğu (sürekli durum) fonksiyonları çarpımına eşittir f arasında X parametrize İçeride ISTV melerin RWMAIWi'nin . Olabilirlik, verilere verilen parametrenin bir fonksiyonudur. Θ'nın , rastgele bir değişken değil , optimize ettiğimiz bir parametre olduğuna dikkat edin , bu nedenle kendisine atanmış herhangi bir olasılık yoktur. Bu nedenle Wikipedia, koşullu olasılık gösterimini kullanmanın, rastgele bir değişkeni şartlandırmadığımız için belirsiz olabileceğini belirtmiştir. Başka bir taraftan, Bayesian içinde ayar θ olduğuθ XfXθθθ rastgele bir değişken ve dağılımı var, onunla diğer rastgele değişkenlerde olduğu gibi çalışabilir ve posterior olasılıkları hesaplamak için Bayes teoremini kullanabiliriz. Bayesian olabilirlik hala olasılık olabilir, çünkü parametre verilen verinin olasılığını bize bildirir, tek fark parametrenin rasgele değişken olarak kabul edilmesidir.

Programlamayı biliyorsanız, programlamada aşırı yüklü fonksiyon olarak olabilirlik fonksiyonunu düşünebilirsiniz . Bazı programlama dilleri, farklı parametre tipleri kullanılarak çağrıldığında farklı şekilde çalışan bir işleve sahip olmanızı sağlar. Bunun gibi bir olasılık olduğunu düşünüyorsanız, varsayılan olarak bazı parametre değerlerini argüman olarak alır ve bu parametreye verilen verilerin olasılığını döndürür. Diğer yandan, bu tür bir işlevi, parametrenin rasgele değişken olduğu Bayes ayarında kullanabilirsiniz, bu temelde aynı çıktıya yol açar, ancak rasgele değişkeni koşullandırdığımız için koşullu olasılık olarak anlaşılabilir. Her iki durumda da fonksiyon aynı şekilde çalışır, sadece onu kullanır ve biraz farklı şekilde anlarsınız.

// likelihood "as" overloaded function
Default Likelihood(Numeric theta, Data X) {
    return f(X, theta); // returns likelihood, not probability
}

Bayesian Likelihood(RandomVariable theta, Data X) {
    return f(X, theta); // since theta is r.v., the output can be
                        // understood as conditional probability
}

Dahası, Bayes teoremini yazan Bayesanlar'ı bulamazsınız.

P(θ|X)L(θ|X)P(θ)

... bu çok kafa karıştırıcı olurdu . Öncelikle, olurdu Denklemin her iki tarafında da X ve fazla bir anlamı olmazdı. İkincisi, elimizdeki posterior olasılığı hakkında bilmek olasılık θ verilen veri (yani o şey istiyorum likelihoodist çerçevede bilmek, ama ne zaman değil mi θ rastgele değişken değildir). Üçüncüsü, θ rastgele bir değişken olduğundan, onu koşullu olasılık olarak yazdık ve yazdık. Lθ|XθθθL-notation genellikle olabilirlikçi ayar için ayrılmıştır. İsim olasılığı, benzer bir şeyi belirtmek için her iki yaklaşımda da konvansiyon tarafından kullanılır: Bu tür verilerin gözlemlenme olasılığı, modelinize ve parametrenize göre verilmiştir.


Teşekkürler Tim, bu benim anlayışımda çok yardımcı oldu. Bu yeni bilgiyle sorumu ("Düzenle" başlığına bakınız) yeniden birleştirdim. Şimdi yazdığım her şeyin doğru olduğuna inanıyorum. Beklentilerden yalnızca biri, Bayes kuralındaki listedeki son nokta. Bir göz atabilirseniz çok memnun olurum. Tekrar teşekkürler, ve bir oyum var!
Creatron

1
@Creatron Cevabınıza son merminizle ilgili bir cümle ekledim, umarım şimdi açıktır - lütfen söylemediyseniz.
Tim

(1/2) Aşırı yüklenmiş operatördeki düzenlemeleriniz bana çok yardımcı oluyor. Fisher muhtemelen ne anlama geldiğini anlamında), durumunda, 'matematiksel olarak saf' (tarihi durumda Altında 1): Bu durumda, biz bu söyleyebiliriz geliyor bana rastgele değişken değildir ve bunun yerine bir parametredir Bir PDF’nin (veya bir parametrenin) fonksiyonu) olması durumunda olasılık, P’nin ( X = x ; θ ) ihtimaline eşittir . Olabilirlik işlevi bir olasılık dağılımı DEĞİLDİR, elbette, ancak P ( X = x ; θ ) olasılığına eşittir . Bu doğru mu? θP(X=x;θ)P(X=x;θ)
Creatron

(2/2) Bununla birlikte, ikinci durumda, (2), bağlam Bayesian ayarı olduğunda, o zaman bu durumda parametrelerimiz bir rv'dir ve bu durumda, olasılık, aslında koşullu bir olasılık dağılımıdır. P (b | a), ancak L (a | b) olarak yazılmıştır. Dolayısıyla, ilk 'varsayılan' durumda, olasılık kesinlikle bir olasılık dağılımı değildi (ancak bir olasılık değerine eşitti), ancak ikinci durumda, olasılık aslında bir olasılık dağılımıdır ve olasılık dağılımının şartlı olduğu olasılık, P (b | a) olarak yazılmıştır. Bu doğru mu?
Creatron

2
Teşekkürler Tim, @ amoeba'nın cevabını kabul etmeme rağmen, göreviniz gerçekten bu çeşitli ve derin konsepti, özellikle aşırı yüklenmiş fonksiyonlara olan benzetmenizi anlamama yardımcı oldu. Tekrar teşekkürler!
Creatron

7

Ortak ihtimal tanımlarının, kesin olmayan veya kafa karışıklığına neden olacak şekilde ayrıntı vermeyen bazı yönleri vardır. Wikipedia girişi güzel bir örnek.

İlk olarak, olabilirlik genellikle parametre değeri verilen verinin olasılığına eşit olamaz , çünkü olabilirlik yalnızca bir orantılılık sabiti ile tanımlanır. Fisher, olasılığını ilk kez resmileştirirken açıktı (Fisher, 1922). Bunun nedeni, bir olasılık fonksiyonunun integralinde (veya toplamında) bir kısıtlama olmaması ve parametrenin (değerlerinin) herhangi bir değeri verilen istatistiksel bir modelde veriyi gözlemleme olasılığı olduğu gibi görünüyor. veri değerlerinin ve parametre değerlerinin belirtilmesinin ayrıntı derecesinin kesinliği.x

İkincisi, olabilirlik fonksiyonunu düşünmek, bireysel olabilirliklerden daha yararlıdır. Olabilirlik işlevi, bir olabilirlik işlevinin grafiğinden açıkça görüldüğü gibi model parametre değerlerinin bir işlevidir. Böyle bir grafik, olasılıkların, modelin bu parametre değerlerine ayarlandığında verileri ne kadar iyi tahmin ettiğine göre parametrelerin çeşitli değerlerinin sıralanmasına izin verdiğini görmeyi kolaylaştırır. Olabilirlik fonksiyonlarının araştırılması, verilerin ve parametre değerlerinin rollerini, bence orijinal soruda verilen çeşitli formüllerin bir araya gelmesinden daha açık bir şekilde ortaya koymaktadır.

Olasılıkta olasılık çiftleri oranının kullanılması, parametre değerleri için (model dahilinde) gözlemlenen veriler tarafından sunulan göreceli destek derecesinin, göreceli orantılılık sabitleri problemi ile karşı karşıya kalması nedeniyle, bu sabitler oranla iptal edilir. Sabitlerin, ayrı olabilirlik fonksiyonlarından (yani farklı istatistiksel modellerden) gelen olasılıklar oranında mutlaka iptal edilmeyeceğini not etmek önemlidir.

Son olarak, istatistiksel modelin rolü konusunda açık olmak yararlıdır, çünkü veriler olasılıkla istatistiksel model tarafından da belirlenir. Farklı bir model seçerseniz, farklı bir olabilirlik işlevi elde edersiniz ve farklı bir bilinmeyen orantı sabiti elde edebilirsiniz.

Dolayısıyla, asıl soruya cevap vermek için, olasılıklar herhangi bir tür olasılık değildir. Kolmogorov'un olasılık aksiyomlarına uymuyorlar ve çeşitli olasılık türlerinin oynadığı rollerin çıkarımını istatistiksel olarak desteklemekte farklı bir rol oynuyorlar.

  1. Fisher (1922) İstatistiğin matematiksel temelleri üzerine http://rsta.royalsocietypublishing.org/content/222/594-604/309

1
Yazınızdaki ilk satır, bu konudaki hayal kırıklığımı özetliyor. Her halükarda, postanıza göre bazı sorular, efendim: 1) Bayesian formülü genellikle yazılır.P(a|b)=P(b|a)P(a)P(b)P(b|a)P(a)

@Creatron 1. Hayır, ifadenin mutlaka yanlış olması gerekmez. Olabilirlik işlevi kanıtın hesaplamaya nasıl girdiğini ve olasılık dağılımını birleştirerek olasılık dağılımını sağlar. Bu bağlamda, bilinmeyen orantılılık sabiti bir problem değildir, çünkü olasılık fonksiyonunun ürünü ve önceki olasılık dağılımı, isteğe bağlı olarak doğru birlik bütünlüğüne (veya toplamına) sahip olacak şekilde ölçeklendirilir.
Michael Lew,

2. Bir maksimum olasılık tahmini bulma bağlamında, koşullu bir olasılık veya olasılık kullanıp kullanmadığınızı, parametre değerlerinin tümü boyunca orantılı olacağından farketmez.
Michael Lew

1
L(θ|x)=P(x|θ)L(θ|x)P(x|θ)

Teşekkür ederim Micheal Lew, göreviniz bu sorunu anlamamda çok yardımcı oldu, çok memnun oldum.
Creatron

7

L(θ)θθθ

θL(θ)=,
L(θ)=1θdθΘ
ΘL(θ)dθ=.
L
θP(xθ) and NOT xP(xθ).

2
+1 ve cevabımı düzenlediğiniz için teşekkür ederim; Bunun \midvar olduğunu unuttum .
amip Reinstate Monica diyor

@ amoeba: Yardım etmekten memnun oldum.
Michael Hardy

3

"Bunu okudum:" Verilerde, verilere X = x, (sol taraftaki) verilen teta eşitleme olasılığı, parametrelerin eşit olması koşuluyla, X verilerinin x'e eşit olma olasılığına eşittir. theta ". (Kalın vurgu için benimdir)."

P(x|θ)L(θ|x)

θθ=θθ


P(a|b)L(θ|x)=P(X=x;θ)

P(a|b)=P(b|a) P(a)P(b)P(b|a)

L(θ|x):=P(x|θ)θxLLθ

L(θ|x)P(x|θ)

Bu bana şimdi daha mantıklı geliyor. İlk yardımınız için teşekkürler, @Alex.
Creatron
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.