Açık bu yazı , şu ifadeyi okuyabilirsiniz:
Modeller genellikle sonlu boyutlu bir manifoldda noktalar ile temsil edilir .
On Diferansiyel Geometri ve İstatistik Michael K Murray ve John W Rice bu kavramlar okunabilir bile matematiksel ifadeler görmezden nesir açıklanmıştır. Ne yazık ki, çok az örnek var. MathOverflow'daki bu yazı için de aynı şey geçerli.
Konunun daha resmi bir anlayışına yönelik bir harita veya motivasyon olarak hizmet etmek için görsel bir temsil ile yardım istiyorum.
Manifold üzerindeki noktalar nelerdir? Bu çevrimiçi bulgudan alınan bu alıntı , görünüşte veri noktaları veya dağıtım parametreleri olabileceğini gösteriyor:
Manifoldlar ve bilgi geometrisi istatistikleri, diferansiyel geometrinin istatistiklerle buluşmasının iki farklı yoludur. Manifoldlarla ilgili istatistiklerde, bir manifold üzerinde yatan verilerdir, bilgi geometrisinde veriler , ancak ilgili olasılık yoğunluk fonksiyonlarının parametrelenmiş ailesi bir manifold olarak ele alınır. Bu gibi manifoldlar, istatistiksel manifoldlar olarak bilinir.
Bu diyagramı, burada teğet mekanın bu açıklamasından esinlenerek çizdim :
[ Aşağıdaki hakkındaki yorumu yansıtacak şekilde düzenleyin : ] Bir manifoldda , teğet alanı, ilişkili üzerinden çalışan manifold üzerindeki her olası eğriBu kadar her eğri geçişinden haritaları grubu olarak görülebilir örneğin bileşim olarak tanımlanan , ile manifoldunun yüzeyine gerçek hattından bir eğri (fonksiyon gösterenp∈ M (ψ: R → M )s. p, C ∞ (t)→ R , ( f ∘ ψ ) ′ (t)ψ M p,f,fp) noktasından geçer ve yukarıdaki diyagramda kırmızı renkle gösterilir; ve bir test fonksiyonunu temsil eder. "İzo " beyaz kontur çizgileri gerçek satırda aynı noktaya harita ve nokta çevreleyen .
Eşdeğerlik (veya istatistiklere uygulanan eşdeğerliklerden biri) burada tartışılmıştır ve aşağıdaki alıntı ile ilgilidir :
Üstel bir ailenin parametre alanı boyutlu açık küme içeriyorsa , buna tam sıralama denir.
Tam sıra olmayan bir üstel aileye genel olarak eğri bir üstel aile denir, çünkü tipik olarak parametre alanı küçük boyuttaki bir eğridir s.
Bu, grafiğin yorumunu şu şekilde yapar: dağıtım parametreleri (bu durumda üstel dağılım aileleri için) manifoldda bulunur. veri noktaları, sıralı doğrusal olmayan optimizasyon problemi durumunda fonksiyonu aracılığıyla manifold üzerindeki bir çizgiyle . Bu, fizikteki hızın hesaplanmasına paralel olacaktır: "iso-f" çizgilerinin (turuncu renkteki yönlü türev) gradyanı boyunca işlevinin türevini aramak : fonksiyonu , bir dağıtım parametresi seçimini eğrisi olarak optimize etme rolünü oynar ψ : R → M f ( f ∘ ψ ) ′ ( t ) . f : M → R ψ fmanifold üzerindeki kontur çizgileri boyunca ilerler .
ARKA PLAN EKLENEN PERSONEL:
Not olarak, bu kavramların derhal ML'deki doğrusal olmayan boyutsal azalma ile ilgili olmadığını düşünüyorum . Bilgi geometrisine daha çok benziyorlar . İşte bir teklif:
Daha da önemlisi, manifoldlarla ilgili istatistikler, manifold öğreniminden çok farklıdır. İkincisi, hedefin değerli verilerden gizli bir manifoldu öğrenmek olduğu bir makine öğrenimi dalıdır . Tipik olarak, aranan gizli manifoldun boyutu küçüktür . Gizli manifold, kullanılan özel yönteme bağlı olarak doğrusal veya doğrusal olmayabilir. n
İle Manifoldlar Üzerinde İstatistikler'den aşağıdaki bilgiler Modelleme Şekli Deformasyonlarının Başvurularda tarafından Ören Freifeld :
Birlikte genellikle doğrusal olduğu için, ile temsil edilen bir teğet alanı ilişkilendirebilir her nokta için, . , boyutu aynı olan bir vektör uzayıdır . Kökeni olan . Eğer bir Öklid uzay gömülü olduğu için, düşünebilir benzeşik bir bölme odası bu şekilde gösterilen: 1) dokunduğu de ; 2) en azından yerel olarak, tamamen bir tarafında bulunur. TpM öğelerine teğet vektörler denir.T p M p ∈ M T p M M T p M p M T p M M p M
[...] Manifoldlarda, istatistiksel modeller genellikle teğet alanlarda ifade edilir.
[...]
[İki tane düşünüyoruz] veri setleri noktalardan oluşur :
;
Let ve muhtemelen bilinmeyen iki, noktaları temsil . İki veri kümesinin aşağıdaki istatistiksel kuralları karşıladığı varsayılmaktadır:μ S M
{ log μ S ( q 1 ) , ⋯ , log μ S ( q N S ) } ⊂ T μ S M ,
[...]
Başka bir deyişle, teğet boşluğunda ( ) ifade edildiğinde (teğet vektörler olarak), kovaryanslı sahip sıfır ortalama bir Gaussian'dan bir iid örnekleri kümesi olarak görülebilir . Benzer şekilde, teğet boşluğunda ifade edildiğinde, kovaryanslı ile sıfır-ortalama Gaussian'dan bir iid örneği kümesi olarak görülebilir . Bu Öklid vakasını genelleştirir. M μ L Σ L D S μ S Σ S
Aynı referansta, sorduğum bu grafik kavramın çevrimiçi olarak en yakın (ve sadece pratik) örneğini buluyorum:
Bu, verilerin teğet vektörler olarak ifade edilen manifoldun yüzeyinde olduğunu ve parametrelerin Kartezyen bir düzlemde eşleneceğini gösterir mi?