Negatif Türetme. Sıkışmak


13

Yani, bu soru biraz dahil olmakla birlikte, bunu olabildiğince basit bir şekilde ileriye doğru yapmaya çalıştım.

Hedef: Uzun lafın kısası, yok negentropi bir türetme vardır değil yüksek mertebeden cumulant'larının dahil ve bunu elde edilmiştir anlamaya çalışıyorum.

Arka plan: (Tüm bunları anlıyorum)

Burada bulunan 'Bağımsız Bileşen Analizi' kitabını kendi kendime çalışıyorum . (Bu soru Bölüm 5.6'dan alınmıştır, 'Entropinin Polinom Olmayan Fonksiyonlarla Yaklaştırılması' kitabına sahipseniz).

Biz kimin negentropi elimizdeki bazı gözlemlerden tahmin etmek isteyen rastgele değişken ve hangi. PDF verilir . Nögentropi, standartlaştırılmış bir Gauss rasgele değişkeninin diferansiyel entropisi ile diferansiyel entropisi arasındaki farktır . Buradaki diferansiyel entropi tarafından verilir , böylece:x p x ( ζ ) x Yxxpx(ζ)xH

H(x)=px(ζ)log(px(ζ))dζ

ve böylece, negentropi tarafından verilir

J(x)=H(v)H(x)

burada , tarafından PDF verilen standart bir Gauss rv'dir .ϕ ( ζ )vϕ(ζ)

Şimdi, bu yeni yöntemin bir parçası olarak, kitabım PDF'sinin bir tahminini şu şekilde verdi:x

px(ζ)=ϕ(ζ)[1+iciFi(ζ)]

(Burada . Bu arada, olan değil , bir güç, ancak bir dizin yerine).ici=E{Fi(x)}i

Şimdilik, bu yeni PDF formülünü 'kabul ediyorum' ve başka bir gün soracağım. Bu benim asıl sorunum değil. Şimdi yaptığı şey, PDF'sinin bu versiyonunu negentropi denklemine geri takmak ve şu şekilde bitiyor:x

J(x)12iE{Fi(x)}2

Unutmayın, sigma (burada ve yazının geri kalanı için), sadece indeks etrafında döngüler . Örneğin, sadece iki fonksiyonumuz olsaydı, sinyal ve için dönecektir . Tabii ki, size kullandığı işlevleri anlatmalıyım. Görünüşe göre, bu fonksiyonları şu şekilde tanımlanır:i = 2 i = 2 F iii=2i=2Fi

Fonksiyonlar bu durumda polinom fonksiyonlar değildir. (Rv sıfır ortalama ve birim varyans olduğu varsayılmaktadır ). Şimdi, bazı kısıtlamalar yapalım ve bu işlevlerin özelliklerini verelim: xFix

Fn+1(ζ)=ζ,cn+1=0

Fn+2(ζ)=ζ2,cn+1=1

Hesaplamaları basitleştirmek için, tamamen teknik bir varsayım daha yapalım: , şöyle bir ortonormal sistem oluşturur:Fi,i=1,...n

ϕ(ζ)Fi(ζ)Fj(ζ)dζ={1,if i=j0,if ij

ve

ϕ(ζ)Fi(ζ)ζkd(ζ)=0,for k=0,1,2

Neredeyse! Tamam, o zaman tüm bunlar arka plandı ve şimdi soru için. Bu durumda görev, bu yeni PDF'yi diferansiyel entropi formülüne yerleştirmektir . Bunu anlarsam, gerisini anlayacağım. Şimdi, kitap türetmeyi veriyor (ve ben buna katılıyorum), ama sonuna doğru sıkışıp kaldım, çünkü nasıl iptal edildiğini bilmiyorum / göremiyorum. Ayrıca, Taylor genişlemesindeki small-o gösterimini nasıl yorumlayacağımı bilmiyorum.H(x)

Sonuç budur:

Taylor genişletme kullanarak şunu elde ederiz:(1+ϵ)log(1+ϵ)=ϵ+ϵ22+o(ϵ2)H(x)

H(x)=ϕ(ζ)(1+ciFi(ζ))(log(1+ciFi(ζ)+log(ζ))d(ζ)=ϕ(ζ)log(ζ)ϕ(ζ)ciFi(ζ)log(ϕ(ζ))ϕ(ζ)[ciFi(ζ)+12(ciFi(ζ))2+o((ciFi(ζ))2)]

ve bu yüzden

Soru: (Bunu anlamıyorum)

H(x)=H(v)0012ci2+o((ci)2

Yani, benim sorunum: hariç , son denklemde son 4 terimi nasıl elde ettiğini anlamıyorum. (örneğin, 0, 0 ve son 2 terim). Bundan önce her şeyi anlıyorum. Yukarıdaki özelliklerde verilen diklik ilişkilerinden yararlandığını söylüyor, ama nasıl olduğunu göremiyorum. (Ayrıca burada nasıl kullanıldığı anlamında small-o notasyonunu da anlamıyorum.)H(v)

TEŞEKKÜRLER!!!!

DÜZENLE:

İlerledim ve okuduğum kitaptan görüntüler ekledim, yukarıda söylediklerimi hemen hemen söylüyor, ancak birisinin ek bir bağlama ihtiyacı olması durumunda.

resim açıklamasını buraya girin resim açıklamasını buraya girin resim açıklamasını buraya girin

Ve burada, kırmızı ile işaretlenmiş, beni şaşırtan kısım. İşlerin iptal edildiği son bölümü ve içeren son toplamları ve küçük-o gösterim toplamını elde etmek için dikeylik özelliklerini nasıl kullanır ?ci2


1
İpucu : Açıkça ve iki orta terim için sıfırları almak için yazarın belirtilen varsayımlarını kullanın. Blok alıntı dahil birkaç yazım hatası olmalıdır; ör. , verdiğiniz ortonormal temel tanımında yanlış yerde görünüyor. logϕ(x)
kardinal

@cardinal Tamam, yazım hatası düzeltildi, teşekkürler. Bununla birlikte, iptal işlemini nasıl gerçekleştirdiği konusunda net değilim. Ben kitabın kendisinden btw gerçek görüntüleri ekledim.
Spacey

2
Dürüst olmak gerekirse, bunun matematik sitesinden nasıl veya neden taşındığına dair hiçbir fikrim yok. Her halükarda, burada eşit derecede evde olduğu için mutluyum. Soruya çok çaba harcadınız. :-)
kardinal

2
@cardinal Bunu söylediğini duymak beni çok memnun ediyor. :-) Evet, umarım bu kendi kendine çalışma yatırımı bir gün öder. ;-)
Spacey

2
Olacak, @Mohammad, olacak! ICA da çok ilginç bir konudur :-).
Néstor

Yanıtlar:


9

İlk olarak, sabit olduğunu (beklenti değerleri, sayılardır!) Hatırlayın, böylece integrallerin dışına alınabilirler (göremiyorsanız, notasyonu rahatsız ediyor sizi, sadece değiştirirseniz tarafından üzerine ).ci

ci=p0(ξ)Gi(ξ)dξ.
ξξci

>> Sıfır terimi elde etmek için:

olduğunu hatırlayın . @Cardinal tarafından önerildiği gibi, açıkça yazmanız gerekir: Elinizdeyken şunları not etmeniz gerekir: burada Sabitleri integrallerin dışına çıkardım.φ(ξ)=exp(ξ2/2)/2πlogφ(ξ)

logφ(ξ)=ξ2/2log2π.
ciφ(ξ)Gi(ξ)logφ(ξ)=12ciφ(ξ)Gi(ξ)ξ2log2πciφ(ξ)Gi(ξ),   (1)

Buradan (5.39) 'de o olduğu belirtilerek not olan için . Denklemin sağındaki ilk terimin integrali. bu formdadır ( ) ve ikinci terimdeki integral de ( ). Bu meblağdan meblağlardan yararlanmanız gerekiyor ve işiniz bitti!φ(ξ)Fi(ξ)ξk0k=0,1,2(1)k=2k=0

>> terimlerini edinmek için :ci2

Bu terimleri elde etmek için elde edilecek integralin: Kare toplamı genişletmek için multinom teoremini kullanabiliriz . Bu bize şunu verir: Ancak, yine (5.39) 'dan, bu toplamdaki , için sıfır ve için birdir . Bu, bizi

φ(ξ)(i=1nciGi(ξ))2dξ.
φ(ξ)k1+k2+...kn=22!k1!k2!...kn!1tn(ctGt(ξ))ktdξ.
φ(ξ)Gi(ξ)Gj(ξ)dξ
iji=j
φ(ξ)(ciGi(ξ))2dξ=ci2.

>> notasyonu hakkındao(whatever)

Bunun yazarlardan oldukça kafa karıştırıcı olduğunu düşünüyorum, ancak bunu her zaman koyduklarında sipariş terimleri olduğunu (yani, tıpkı büyükler gibi kullandıklarını hatırlıyorum. -O gösterim). Ancak @Macro'nun aynı cevap üzerine yorumladığı gibi, büyük-O notasyonu ile küçük-O notasyonu arasında bir fark vardır. Belki kendiniz kontrol etmeli ve bu Wikipedia makalesinde hangisinin soruna uygun olduğunu görmelisiniz .o ( neyse )whatevero(whatever)

Not: Bu arada harika bir kitap. Konuyla ilgili yazarların makaleleri de çok iyi ve ICA'yı anlamaya ve uygulamaya çalışıyorsanız mutlaka okumalısınız.


1
(+1) İyi cevap. Eğer meblağlar sonsuzsa, onları integralle değiştirmek konusunda daha dikkatli olmalıyız. Eğer sonlularsa (OP'nin önerdiği gibi, ama görüntülere yakından bakmadım), o zaman her şey basittir, gösterdiğiniz gibi. :-)
kardinal

Ah evet! Teşekkür ederim Nestor, ama son iki sonuç, yani ile toplama ve small-o gösterim kısmı ile toplama ne olacak? ci2
Spacey

1
@cardinal: Ah evet! Sonludurlar (neden sonsuz yere yazdığımı bilmiyorum ...). Cevabımda bunu değiştirdim.
Néstor

@Mohammad, cevaplarıma diğer iki sorunuzu yazıyorum ;-).
Néstor

1
@ Néstor, bu cevabı + 1'leyiniz ama yeniden: son yorumunuz, sanırım büyük-O ve küçük-o gösterim arasında bir ayrım var .
Makro
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.