Jacobian faktörüne bağlı farklı olasılık yoğunluk dönüşümleri


12

Bishop'un Örüntü Tanıma ve Makine Öğreniminde , olasılık yoğunluğundan hemen sonra aşağıdakileri okudum :p(x(a,b))=abp(x)dx

Doğrusal olmayan bir değişken değişikliği altında, olasılık yoğunluğu, Jacobian faktörüne bağlı olarak basit bir işlevden farklı bir şekilde dönüşür. Örneğin, değişkenlerinde bir değişiklik düşünürsek , işlevi . Şimdi , yeni değişken göre yoğunluğuna karşılık gelen bir olasılık yoğunluğu , burada ve nin farklı yoğunluklar olduğunu gösterir. Aralıkta düşen gözlemler , değerleri için aralığa dönüştürülecekx=g(y)f(x)f~(y)=f(g(y))px(x)py(y)ypx(x)py(y)(x,x+δx)δx(y,y+δy ) burada px(x)δxpy(y)δy ve dolayısıylapy(y)=px(x)|dxdy|=px(g(y))|g(y)|.

Jacobian faktörü nedir ve her şey tam olarak ne anlama gelir (belki niteliksel olarak)? Bishop, bu özelliğin bir sonucunun, maksimum olasılık yoğunluğu kavramının değişken seçimine bağlı olduğunu söylüyor. Ne anlama geliyor?

Bana göre bu biraz maviden çıkıyor (giriş bölümünde olduğu düşünülüyor). Bazı ipuçlarını takdir ediyorum, teşekkürler!



1
Jacobian faktörünün büyük bir açıklaması için Khan Academy'nin Jacobian determinantına ilişkin video eğitimine bakın. khanacademy.org/math/multivariable-calculus/…
JStrahl

Yanıtlar:


8

İyi bir sezgi sağlayan Soru 1.4'ün çözümünü okumanızı öneririm .

Özetle, rastgele bir fonksiyonuna ve fonksiyonuyla birbiriyle ilişkili iki değişken ve sahipseniz, fonksiyonunu doğrudan analiz ederek : veya dönüştürülmüş işlev : . Şaşırtıcı değil, ve her biri (burada .x Y x = g ( y ) f ( x ) x = a r gr m bir X X ( f ( x ) ) f ( g ( y ) ) y = bir r gr m bir X -Y ( f ( g ( y ) ) x yf(x)xyx=g(y)f(x)x^=birrgmbirxx(f(x))f(g(y))y^=argmaxy(f(g(y))x^y^y:g'(y)0)x^=g(y^)y:g(y)0)

Bu olasılık dağılımları için geçerli değildir. Bir olasılık dağılımınız ve birbiriyle ilişkili iki rastgele değişkeniniz varsa . O zaman ve arasında doğrudan bir ilişki yoktur . Bu, hacmin Gibi bir işlevle göreceli olarak nasıl değiştiğini gösteren bir faktör olan Jacobian faktörü nedeniyle olur .px(x)x=g(y)x^=argmaxx(px(x))y^=argmaxy(py(y))g(.)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.