Bir manifold üzerindeki istatistiklerin grafiksel sezgisi


12

Açık bu yazı , şu ifadeyi okuyabilirsiniz:

Modeller genellikle sonlu boyutlu bir manifoldda noktalar ile temsil edilir .θ

On Diferansiyel Geometri ve İstatistik Michael K Murray ve John W Rice bu kavramlar okunabilir bile matematiksel ifadeler görmezden nesir açıklanmıştır. Ne yazık ki, çok az örnek var. MathOverflow'daki bu yazı için de aynı şey geçerli.

Konunun daha resmi bir anlayışına yönelik bir harita veya motivasyon olarak hizmet etmek için görsel bir temsil ile yardım istiyorum.

Manifold üzerindeki noktalar nelerdir? Bu çevrimiçi bulgudan alınan bu alıntı , görünüşte veri noktaları veya dağıtım parametreleri olabileceğini gösteriyor:

Manifoldlar ve bilgi geometrisi istatistikleri, diferansiyel geometrinin istatistiklerle buluşmasının iki farklı yoludur. Manifoldlarla ilgili istatistiklerde, bir manifold üzerinde yatan verilerdir, bilgi geometrisinde veriler , ancak ilgili olasılık yoğunluk fonksiyonlarının parametrelenmiş ailesi bir manifold olarak ele alınır. Bu gibi manifoldlar, istatistiksel manifoldlar olarak bilinir.Rn


Bu diyagramı, burada teğet mekanın bu açıklamasından esinlenerek çizdim :

resim açıklamasını buraya girin

[ Aşağıdaki hakkındaki yorumu yansıtacak şekilde düzenleyin :C ] Bir manifoldda , teğet alanı, ilişkili üzerinden çalışan manifold üzerindeki her olası eğriBu kadar her eğri geçişinden haritaları grubu olarak görülebilir örneğin bileşim olarak tanımlanan , ile manifoldunun yüzeyine gerçek hattından bir eğri (fonksiyon gösterenp M (ψ: R M )s. p, C (t) R , ( f ψ ) (t)ψ M p,f,fp(M)pM(ψ:RM)p.p,C(t)R,(fψ)(t)ψM) noktasından geçer ve yukarıdaki diyagramda kırmızı renkle gösterilir; ve bir test fonksiyonunu temsil eder. "İzo " beyaz kontur çizgileri gerçek satırda aynı noktaya harita ve nokta çevreleyen .p,f,fp

Eşdeğerlik (veya istatistiklere uygulanan eşdeğerliklerden biri) burada tartışılmıştır ve aşağıdaki alıntı ile ilgilidir :

Üstel bir ailenin parametre alanı boyutlu açık küme içeriyorsa , buna tam sıralama denir.s

Tam sıra olmayan bir üstel aileye genel olarak eğri bir üstel aile denir, çünkü tipik olarak parametre alanı küçük boyuttaki bir eğridir s.Rss.

Bu, grafiğin yorumunu şu şekilde yapar: dağıtım parametreleri (bu durumda üstel dağılım aileleri için) manifoldda bulunur. veri noktaları, sıralı doğrusal olmayan optimizasyon problemi durumunda fonksiyonu aracılığıyla manifold üzerindeki bir çizgiyle . Bu, fizikteki hızın hesaplanmasına paralel olacaktır: "iso-f" çizgilerinin (turuncu renkteki yönlü türev) gradyanı boyunca işlevinin türevini aramak : fonksiyonu , bir dağıtım parametresi seçimini eğrisi olarak optimize etme rolünü oynar ψ : RM f ( f ψ ) ( t ) . f : MR ψ fRψ:RMf(fψ)(t).f:MRψmanifold üzerindeki kontur çizgileri boyunca ilerler .f


ARKA PLAN EKLENEN PERSONEL:

Not olarak, bu kavramların derhal ML'deki doğrusal olmayan boyutsal azalma ile ilgili olmadığını düşünüyorum . Bilgi geometrisine daha çok benziyorlar . İşte bir teklif:

Daha da önemlisi, manifoldlarla ilgili istatistikler, manifold öğreniminden çok farklıdır. İkincisi, hedefin değerli verilerden gizli bir manifoldu öğrenmek olduğu bir makine öğrenimi dalıdır . Tipik olarak, aranan gizli manifoldun boyutu küçüktür . Gizli manifold, kullanılan özel yönteme bağlı olarak doğrusal veya doğrusal olmayabilir. nRnn


İle Manifoldlar Üzerinde İstatistikler'den aşağıdaki bilgiler Modelleme Şekli Deformasyonlarının Başvurularda tarafından Ören Freifeld :

resim açıklamasını buraya girin

Birlikte genellikle doğrusal olduğu için, ile temsil edilen bir teğet alanı ilişkilendirebilir her nokta için, . , boyutu aynı olan bir vektör uzayıdır . Kökeni olan . Eğer bir Öklid uzay gömülü olduğu için, düşünebilir benzeşik bir bölme odası bu şekilde gösterilen: 1) dokunduğu de ; 2) en azından yerel olarak, tamamen bir tarafında bulunur. TpM öğelerine teğet vektörler denir.T p M p M T p M M T p M p M T p M M p MMTpMpMTpMMTpMpMTpMMpM

[...] Manifoldlarda, istatistiksel modeller genellikle teğet alanlarda ifade edilir.

[...]

[İki tane düşünüyoruz] veri setleri noktalardan oluşur :M

DL={p1,,pNL}M ;

DS={q1,,qNS}M

Let ve muhtemelen bilinmeyen iki, noktaları temsil . İki veri kümesinin aşağıdaki istatistiksel kuralları karşıladığı varsayılmaktadır:μ S MµLµSM

{ log μ S ( q 1 ) , , log μ S ( q N S ) } T μ S M ,{logμL(p1),,logμL(pNL)}TμLM,logμL(pi)i.i.dN(0,ΣL) {logμS(q1),,logμS(qNS)}TμSM,logμS(qi)i.i.dN(0,ΣS)

[...]

Başka bir deyişle, teğet boşluğunda ( ) ifade edildiğinde (teğet vektörler olarak), kovaryanslı sahip sıfır ortalama bir Gaussian'dan bir iid örnekleri kümesi olarak görülebilir . Benzer şekilde, teğet boşluğunda ifade edildiğinde, kovaryanslı ile sıfır-ortalama Gaussian'dan bir iid örneği kümesi olarak görülebilir . Bu Öklid vakasını genelleştirir. M μ L Σ L D S μ S Σ SDLMμLΣLDSμSΣS

Aynı referansta, sorduğum bu grafik kavramın çevrimiçi olarak en yakın (ve sadece pratik) örneğini buluyorum:

resim açıklamasını buraya girin

Bu, verilerin teğet vektörler olarak ifade edilen manifoldun yüzeyinde olduğunu ve parametrelerin Kartezyen bir düzlemde eşleneceğini gösterir mi?


1
Burada ne yapmaya çalışıyorsun? Manifoldlar çizilsin mi? Çoğu çizmek için çok sıkıcı. Örneğin, Gauss dağılımını deneyin.
Aksakal

Normalde parametre boşluklarını vektör boşlukları gibi düşünürdüm, örneğin . Eğer parametrik "manifoldları" düşünürsem, akla ilk gelen şey "kısıtlama sistemleri" olurdu, örneğin . Aksi halde, alan neden "tamamlanmadı"? ("Manifold" olan f ( θ ) = 0θRnf(θ)=0
altkümeyi

2
Umarım, @whuber sohbet ederek yaptığı yorumlar üzerinde durur.
gung - Monica'yı eski

1
Düzenlenen sorunuzun kısa cevabı "hayır" dır. Teğet boşluk, manifolddaki tüm düz yolların hızlarını tanımlar. İstatistiklerdeki temel rolü, manifoldun son derece parametreli bir aileyi tanımladığı olasılıkları en üst düzeye çıkarmaktır. "Manifold öğreniminde" bir manifold, verilere yerel bir yaklaşım olarak kullanılır - bu, lineer regresyondaki "sütun boşluğunun" kavisli bir versiyonudur. Orada, teğet boşluk ortam Öklid boşluğunun içine gömülüdür . Yerel olarak, verilerin "yönlerini" tanımlar ve normal paketi "hata" yönlerini verir.
whuber

1
Evet: kotanjant uzay de etrafında fonksiyonların mikropların sözcükler olarak tanımlanabilir . Teğet uzay (dolayısıyla!) Sadece onun ikili olduğunu. ve bir topoloji elde eder - yani, üzerindeki koordinat grafikleri aracılığıyla ve "yakın" olduğu iki teğet boşluk kavramını kabul edin . Bu, tanjant alanını tanımlamanın tanımını (ve görselleştirme sorununu) azaltır . Bu, kaynaklı tüm vektörlerin kümesidir . Spivak, Manifoldlar Üzerinde Analizp p p T M T M T p M T q M M T x R n xTpMpppTMTMTpMTqMMTxRnx, bu türün açık ve temel bir tanımını sağlar.
whuber

Yanıtlar:


3

Olasılık dağılımları ailesi, dağıtım parametrelerine karşılık gelen iç koordinatlara sahip bir manifold üzerindeki noktalar olarak analiz edilebilir . Fikir, yanlış bir metriğe sahip bir gösterimden kaçınmaktır: Tek Değişkenli Gaussians aşağıdaki grafiğin sağ tarafında olduğu gibi Öklid manifoldunda noktalar olarak çizilebilir ortalama ile -Axis ve SD eksenine (varyans çizilmesi durumunda pozitif yarısı):, N ( μ , σ 2 ) , R ' 2 x y(Θ)N(μ,σ2),R2xy

resim açıklamasını buraya girin

Bununla birlikte, kimlik matrisi (Öklid mesafesi), bireysel 'ler arasındaki (dis-) benzerlik derecesini ölçmede başarısız olacaktır : etki alanında bir aralık verildiğinde, yukarıdaki grafiğin solundaki normal eğrilerde, örtüşmesiz alan (koyu mavi renkte), ortalama sabit tutulmuş olsa bile, düşük varyanslı Gauss eğrileri için daha büyüktür. Aslında, istatistiksel manifoldlar için “mantıklı” olan tek Riemann metriği Fisher bilgi metriğidir .pdf

Gelen Fisher bilgi mesafesi: geometrik bir okuma , Costa SI, Santos SA ve Strapasson JE arasındaki benzerlik yararlanmak Gauss dağılımlarının Fisher bilgi matrisi ve metrik Beltrami-Pointcaré disk modeli kapalı bir formül elde etmek.

Hiperboloit "kuzey" konisi, her bir noktanın ortalama ve standart sapmaya (parametre boşluğu) ve arasındaki en kısa mesafeye karşılık geldiği Öklid olmayan bir manifold olur. Aşağıdaki diyagramdaki örneğin ve ekvator düzlemine hiperparabolik düz çizgiler olarak yansıtılan ( arasındaki mesafelerin bir metrik tensörle ölçülmesini sağlayan bir jeodezik eğridir. - Fisher bilgi metriği :x2+y2x2=1pdfs,PQ,pdfsgμν(Θ)eμeν

D(P(x;θ1),Q(x;θ2))=minθ(t)|θ(0)=θ1,θ(1)=θ201(dθdt)I(θ)dθdtdt

ile

I(θ)=1σ2[1002]

resim açıklamasını buraya girin

Kullback-Leibler diverjans yakın bir geometri eksik ve metrik ilişkili olsa ilgilidir.

Ve Fisher bilgi matrisinin Shannon entropisinin Hessili olarak yorumlanabileceğini belirtmek ilginçtir :

gij(θ)=E[2logp(x;θ)θiθj]=2H(p)θiθj

ile

H(p)=p(x;θ)logp(x;θ)dx.

Bu örnek kavram olarak daha yaygın stereografik Dünya haritasına benzer .

ML çok boyutlu gömme veya manifold öğrenme burada ele alınmamıştır.


1

Olasılıkları geometri ile ilişkilendirmenin birden fazla yolu vardır. Eminim eliptik dağılımları duymuşsunuzdur (örneğin Gaussian). Terimin kendisi geometri bağlantısını ifade eder ve kovaryans matrisini çizdiğinizde açıktır . Manifoldlar ile, sadece mümkün olan her parametre değerini koordinat sistemine yerleştirir. Örneğin, bir Gauss Manifoldu iki boyutta olacaktır: . değerine sahip olabilirsiniz, ancak yalnızca pozitif varyanslar . Bu nedenle, Gauss manifoldu tüm alanının yarısı olacaktır . O kadar ilginç değil μ R σ 2 > 0 R 2μ,σ2μRσ2>0R2


Sanırım bir "manifold" un gömme alanından daha düşük bir boyut olması gerektiğini düşündüm. Yani bir yarım boşluk sayılmaz mı?
GeoMatt22

Gaussian ile bu bir manifold bile değil, değil mi? Kısıtlamalara ihtiyacınız var, bu yüzden bir tür uçak veya çizgi haline geliyor
Aksakal

Sana "demek oluyor bu ... Cevabınızı etkilerini anlamaya çalışıyorum bir geometri bağlantısını"? Ayrıca, MathOverflow ile ilgili yazıyı buldum .
Antoni Parellada

3
Fisher-Rao gibi uygun bir metrikle daha ilginç hale gelir ve daha sonra Poincare hiperbolik yarı yer en.wikipedia.org/wiki/Poincar%C3%A9_half-plane_model olur
mic

2
Herkes için: (1) parametrik aileleri tanımlayan manifoldlar içsel manifoldlardır: herhangi bir vektör uzayda gömülmeleri gerekmez. (2) Bunlar sadece farklılaştırılabilir manifoldlardan daha fazlasıdır: Fisher Information , onlara geometrik bir şekilde çalışılmalarını sağlayan bir Riemann metriğine ( yerel bir mesafe) sahiptir. Bu, "tüm boşluğunun yarısını " kavisli bir yüzeye dönüştürür. R2
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.