"Manifold varsayımı" nın pek çok hesabına bakarak, birçok yazarın anlamında özellikle özensiz olduğu hemen anlaşılır. Daha dikkatli olanlar bunu ince ama son derece önemli bir uyarı ile tanımlar : verilerin düşük boyutlu bir manifoldda veya ona yakın olması .
Onların uygulamaları nedeniyle Hatta "ya yakın" include etmeyenler fıkra açıkça matematiksel analizini gerçekleştirmek için uygun yaklaşık bir kurgu olarak manifoldu varsayımını kabul edilmelidir veri ve tahmini manifoldu arasındaki sapmaları düşünmek. Aslında, birçok yazar daha sonra bu gerilemesinin tasarladığı olarak sapmalar için açık bir mekanizma sunmak karşı burada isimli kısıtlanmış yalan üzerinde bir manifold , ancak içerebilir rastgele sapmalar. Bu varsayarak eşdeğer olduğunu küpe yalan yakınyxxMk⊂Rd y(xi,yi)formun içine daldırılmış bir -boyutlu manifoldunak
(x,f(x))∈Mk×R⊂Rd×R≈Rd+1
bazı düz (regresyon) fonksiyonlar için . Sadece (a boyutlu bir manifold) grafiğine yakın olan tüm sapık noktaları , üzerinde boyutlu manifoldu , bu teoride önemsiz olabilir "yakın" dan "açık" ayırt hakkında neden böyle ıslaklık açıklamaya yardımcı olur.f:Rd→R(x,y)=(x,f(x)+ε)fkk+1Mk×R
"Açık" ve "yakın" arasındaki fark uygulamalar için son derece önemlidir. "Yakın", verilerin manifolddan sapmasına izin verir. Bu nedenle, bu manifoldu tahmin etmeyi seçerseniz, veriler ve manifold arasındaki tipik sapma miktarı ölçülebilir. Takılan bir manifold, tipik sapma miktarı daha az olduğunda ceteris paribus olduğunda diğerinden daha iyi olacaktır .
Şekil, veriler için manifold varsayımının iki versiyonunu göstermektedir (büyük mavi noktalar): siyah manifold nispeten basittir (tanımlanması için sadece dört parametre gerektirir), ancak kırmızı noktalı manifold verilere uyurken sadece "yakın" gelir ancak karmaşıktır (17 parametreye ihtiyaç vardır).
Tüm bu problemlerde olduğu gibi, manifoldu tanımlamanın karmaşıklığı ile uyum iyiliği (aşırı uyum sorunu) arasında bir denge vardır. Her zaman tek boyutlu bir manifoldun içindeki herhangi bir sonlu veri miktarına mükemmel şekilde uyduğu bulunur (şekilde kırmızı noktalı manifoldda olduğu gibi, tüm noktalarda düzgün bir eğri çalıştırın , herhangi bir sırayla: neredeyse kesin olarak kendini kesmeyecektir, ancak eğer yaparsa, ortadan kaldırmak için bu tür bir kavşağın mahallesindeki eğriyi bozar). Diğer uçta, sadece sınırlı bir manifold sınıfına izin verilirse (sadece düz Öklid hiperplanları gibi), boyutlardan bağımsız olarak iyi bir uyum imkansız olabilir ve veriler ile uyum arasındaki tipik sapma büyük olabilir.Rd
Bu, manifold varsayımını değerlendirmenin basit ve pratik bir yoluna yol açar: manifold varsayımından geliştirilen model / tahminci / sınıflandırıcı kabul edilebilir derecede iyi çalışıyorsa, varsayım haklı çıkarıldı. Bu nedenle, soruda aranan uygun koşullar , uygunluk iyiliği ölçüsünün kabul edilebilir derecede küçük olması olacaktır. (Hangi önlem? Soruna bağlıdır ve bir kayıp fonksiyonu seçmekle eşdeğerdir.)
Farklı boyuttaki manifoldların (eğriliğindeki farklı kısıtlama türleriyle) verilere sığabilmesi ve uzaktaki verileri tahmin etmesinin eşit derecede iyi olması mümkündür. Özellikle büyük, dağınık, insan veri kümeleriyle çalışırken genel olarak "altta yatan" manifold hakkında "kanıtlanmış" hiçbir şey kanıtlanamaz . Genellikle ümit edebileceğimiz tek şey, monte edilen manifoldun iyi bir model olmasıdır.
İyi bir model / öngörücü / sınıflandırıcı bulmazsanız, ya manifold varsayımı geçersizdir, çok küçük bir boyuta sahip manifoldlar varsayıyorsunuz ya da yeterince sert ya da yeterince iyi görünmüyorsunuz.