Lojistik işlevle dönüştürülmüş bir Gauss rasgele değişkeninin beklenen değeri


10

Hem lojistik fonksiyon hem de standart sapma genellikle gösterilir . Standart sapma için ve kullanacağım .σσ(x)=1/(1+exp(x))s

Ben ortalama ve standart sapma biliyorum rastgele bir giriş ile bir lojistik nöron var . Umarım ortalamadaki fark bazı Gauss gürültüsü ile iyi bir şekilde tahmin edilebilir. Dolayısıyla, hafif bir gösterim kötüye kullanımıyla, ürettiğini varsayın . beklenen değeri nedir ? Standart sapma veya ile karşılaştırıldığında büyük veya küçük olabilir . Beklenen değer için iyi bir kapalı form yaklaşımı, kapalı bir form çözeltisi kadar iyi olacaktır.μsσ(μ+N(0,s2))=σ(N(μ,s2))σ(N(μ,s2))sμ1

Kapalı bir form çözümü olduğunu sanmıyorum. Bu bir kıvrım olarak görülebilir ve lojistik yoğunluğun karakteristik işlevi bilinir ( ), ancak bunun ne kadar yardımcı olduğundan emin değilim. Ters sembolik hesap az yoğunluğunu tanıyamadı öne sürer ama basit temel ayrılmaz olduğunu kanıtlamaz lojistik dağıtımın yoğunluğu kıvrım ve standart normal dağılımın ait. Daha koşullu kanıtlar: Lojistik nöronları olan sinir ağlarına Gauss giriş gürültüsü eklenmesi üzerine bazı makalelerde, bildiriler kapalı form ifadeleri de vermedi.πt csch πt0

Bu soru Boltzman makinelerinde ortalama alan yaklaşımındaki hatayı anlamaya çalışırken ortaya çıktı.

Yanıtlar:


5

Aşağıdakileri kullanarak bitirdim:

Yaz burada . Bir Taylor serisi genişletmesi kullanabiliriz.σ(N(μ,s2))=σ(μ+X)XN(0,s2)

σ(μ+X)=σ(μ)+Xσ(μ)+X22σ(μ)+...+Xnn!σ(n)(μ)+...

E[σ(μ+X)]=E[σ(μ)]+E[Xσ(μ)]+E[X22σ(μ)]+...=σ(μ)+0+s22σ(μ)+0+3s424σ(4)(μ)+...+s2k2kk!σ(2k)(μ)...

Yakınsama sorunları var. Lojistik fonksiyonunun olduğu bir kutbu vardır , bu nedenle , tek olur. Iraksaklık önekin yararsız olmasıyla aynı şey değildir, ancak önemli olduğunda bu seri yaklaşımı güvenilir olmayabilir .exp(x)=1x=kπikP(|X|>μ2+π2)

Yana , biz türevleri yazabilir polinomların olarak . Örneğin, ve . Katsayılar OEIS A028246 ile ilişkilidir .σ(x)=σ(x)(1σ(x))σ(x)σ(x)σ=σ3σ2+2σ3σ=σ7σ2+12σ36σ4


4

Burada sahip olduğunuz, logit-normal (veya logistic-normal) dağılımı izleyen rastgele bir değişkendir ( wikipedia'ya bakın ), yani . Logit-normal dağılım anlarında analitik çözümler yoktur.logit[x]N(μ,s2)

Ama elbette, bunlar sayısal entegrasyon yoluyla elde edilebilir. R kullanırsanız, ihtiyacınız olan her şeye sahip logitnorm paketi vardır. Bir örnek:

install.packages("logitnorm")
library(logitnorm)
momentsLogitnorm(mu=1, sigma=2)

Bu şu sonuçları verir:

> momentsLogitnorm(mu=1, sigma=2)
      mean        var 
0.64772644 0.08767866

Yani, size ortalama ve varyansı doğrudan verecek bir rahatlık fonksiyonu bile var.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.