Fonksiyonel temel bileşen analizi (FPCA): hepsi ne hakkında?


21

Fonksiyonel temel bileşen analizi (FPCA) tökezlediğim ve asla anlayamadığım bir şey. Bütün bunlar ne hakkında?

Bkz Shang 2011 tarafından "işlevsel temel bileşenler analizinin bir anket" ve ben gerekçe ediyorum:

PCA, “boyutsallığın laneti” nedeniyle fonksiyonel verilerin analizinde ciddi zorluklarla karşılaşmaktadır (Bellman 1961). “Boyutsallığın laneti” yüksek boyutlu uzayda veri esnekliğinden kaynaklanmaktadır. PCA'nın geometrik özellikleri geçerli kalsa ve sayısal teknikler istikrarlı sonuçlar verse bile, örnek kovaryans matrisi bazen popülasyon kovaryans matrisinin zayıf bir tahminidir. Bu zorluğun üstesinden gelmek için FPCA, örnek kovaryans yapısını incelemek için PCA'dan çok daha bilgilendirici bir yol sağlar [...]

Sadece anlamıyorum. Bu yazının açıkladığı dezavantaj nedir? PCA'nın “boyutsallığın laneti” gibi durumları ele almak için nihai yöntem olması gerekmez mi?

Yanıtlar:


7

Tam olarak, soruda belirttiğiniz ve @tdc'nin cevabına koyduğu gibi, PCA'nın geometrik özellikleri geçerli olsa bile, aşırı yüksek boyutlarda, kovaryans matrisi artık gerçek popülasyon kovaryansının iyi bir tahmini değildir.


Bir var çok ilginç kağıt "fMRI Verilerinin Fonksiyonel Temel Bileşen Analizi" ( pdf onlar varyansını görselleştirmek için fonksiyonel PCA kullanın):

... Diğer araştırma tekniklerinde olduğu gibi, amaç, uygun bir model seçilmeden önce verilere “kendileri için konuşma” şansı verecek bir ilk değerlendirme sağlamaktır. [...]

Makalede tam olarak nasıl yaptıklarını açıklıyorlar ve ayrıca teorik akıl yürütme sağlıyorlar:

Bu yaklaşımın belirleyici avantajı, temel fonksiyon setinin seçiminde ve uyum tarafından en aza indirilen hata fonksiyonunda bir dizi varsayım belirleme olasılığından oluşur. Bu varsayımlar, önceden belirlenmiş bir hemodinamik fonksiyonun ve F-maskelemede olduğu gibi bir dizi olay veya koşulun spesifikasyonundan daha zayıf olacak ve böylece prosedürün keşif karakterini koruyacaktır; ancak, varsayımlar normal PCA'nın zorluklarının üstesinden gelmek için yeterince sıkı kalabilir.


n×tntntkkt
amoeba, Reinstate Monica

Biraz daha okuduktan sonra kendi cevabımı göndermeye karar verdim. Belki ilgileneceksin. Kesinlikle ek içgörüleri takdir edeceğim.
amip: Reinstate Monica

24

"Fonksiyonel PCA" yı gereksiz yere kafa karıştırıcı bir kavram olarak görüyorum. Ayrı bir şey değil, zaman serilerine uygulanan standart PCA.

ntn×ttn201000t

Burada kesinlikle standart PCA uygulanabilir. Görünüşe göre, alıntıda yazar, ortaya çıkan öz-zaman serisinin çok gürültülü olacağından endişe duyuyor. Bu gerçekten olabilir! Bununla başa çıkmanın iki belirgin yolu (a) PCA'dan sonra ortaya çıkan öz-zaman serisini düzeltmek veya (b) PCA yapmadan önce orijinal zaman serisini düzeltmek olacaktır.

ktk

FPCA üzerinde Öğreticiler genellikle sonsuz boyutluluk fonksiyonel mekanlara PCA genelleme nasıl uzun tartışmalara girmeyeceğim ama bunun pratik alaka olduğunu tamamen beni aşan pratikte işlevsel verileri her zaman başlamak kesiklestirilir olarak.

İşte Ramsay ve Silverman "Fonksiyonel Veri Analizi" ders kitabından alınan ve FPCA dahil "fonksiyonel veri analizi" nin kesin monografı gibi görünen bir örnek:

Ramsay ve Silverman, FPCA

"Ayrıklaştırılmış veriler" (noktalar) üzerinde PCA yapmanın Fourier bazında (satırlar) karşılık gelen fonksiyonlarda FPCA yapmakla hemen hemen aynı şeyi sağladığı görülebilir. Tabii ki ilk önce ayrık PCA yapabilir ve sonra aynı Fourier esasına göre bir işleve uyabilir; aşağı yukarı aynı sonucu verir.

t=12n>t


2
Nadiren düzensiz olarak örneklenmiş yörüngeler durumunda (örn. Boyuna veriler) FPCA, " sonuçta ortaya çıkan öz-zaman serilerini enterpolasyondan ve sonra düzleştirmekten " çok daha fazla dahil olur . Örneğin, bir şekilde seyrek verilerin projeksiyon skorlarını hesaplayan bazı öz bileşenler elde edilse bile iyi tanımlanmamıştır; bakınız örneğin: Yao ve ark. JASA 2005. Düzenli olarak düzenli olarak örneklenen süreçler için verilen FPCA etkin bir şekilde PCA'dır ve bazı pürüzsüzlük cezaları üsttedir.
usεr11852 diyor Reinstate Monic

Teşekkürler, @ usεr11852 (+1). Tekrar bakmak için zaman bulmam gerekiyor. Referans verdiğiniz makaleyi aramaya ve bu cevaba geri dönmeye çalışacağım.
amip diyor ki Reinstate Monica

@amoeba, bu, neredeyse karmaşık bir dalga / zaman serisinin bileşen dalgalarını kurtardığınız ayrık fourier dönüşümü ile ilgili geliyor mu?
Russell Richie

9

Birkaç yıl boyunca FDA'da Jim Ramsay ile çalıştım, bu yüzden @ amoeba'nın cevabına birkaç açıklama ekleyebilirim. Ben pratik düzeyde, @amoeba temelde haklı olduğunu düşünüyorum. En azından, FDA okuduktan sonra nihayet ulaştığım sonuç bu. Bununla birlikte, FDA çerçevesi, özvektörleri yumuşatmanın neden sadece bir çamurdan daha fazlası olduğuna dair ilginç bir teorik bilgi vermektedir. Bir pürüzsüzlük cezası içeren bir iç ürüne tabi olarak fonksiyon uzayında optimizasyonun, temel spline'ların sonlu boyutlu bir çözümünü sağladığı ortaya çıkıyor. FDA, sonsuz boyutlu işlev alanını kullanır, ancak analiz sonsuz sayıda boyut gerektirmez. Gauss süreçlerinde veya SVM'lerde çekirdek hilesi gibi. Aslında çekirdek hilesi gibi.

Ramsay'ın orijinal çalışması, verilerdeki ana hikayenin açık olduğu durumlarla ilgilenmiştir: fonksiyonlar az çok doğrusal veya az çok periyodiktir. Standart PCA'nın baskın özvektörleri sadece fonksiyonların genel seviyesini ve doğrusal eğilimi (veya sinüs fonksiyonlarını) yansıtacak ve temel olarak bize zaten bildiğimiz şeyi söyleyecektir. İlginç özellikler, artık listenin üst kısmından birkaç özvektör olan kalıntılarda yatmaktadır. Ve her müteakip özvektör, öncekilere dik olması gerektiğinden, bu yapılar gittikçe daha çok analizin yapılarına ve daha az verinin ilgili özelliklerine bağlıdır. Faktör analizinde, eğik faktör rotasyonu bu sorunu çözmeyi amaçlamaktadır. Ramsay'ın fikri bileşenleri döndürmek değildi, daha ziyade, ortogonallik tanımını analizin ihtiyaçlarını daha iyi yansıtacak şekilde değiştirmek. Bu, periyodik bileşenlerle ilgileniyorsanız,D3DD2

Eğilimi OLS ile kaldırmanın ve bu operasyonun kalıntılarını incelemenin daha kolay olacağı itiraz edilebilir. FDA'nın katma değerinin, yöntemin muazzam karmaşıklığına değdiğine asla ikna olmadım. Ancak teorik açıdan, ilgili konuları dikkate almaya değer. Verilere yaptığımız her şey işleri karıştırıyor. Orijinal veriler bağımsız olsa bile OLS kalıntıları ilişkilendirilir. Bir zaman serisini yumuşatmak ham seride olmayan otokorelasyonları tanıtır. FDA fikri, ilk tahliyeden elde ettiğimiz artıkların faiz analizine uygun olmasını sağlamaktı.

FDA'nın spline işlevlerinin aktif çalışma altında olduğu 80'lerin başlarında ortaya çıktığını hatırlamanız gerekir - Grace Wahba ve ekibini düşünün. O zamandan bu yana SEM, büyüme eğrisi analizi, Gauss süreçleri, stokastik süreç teorisindeki diğer gelişmeler ve çok daha fazlası gibi çok değişkenli verilere yönelik birçok yaklaşım ortaya çıkmıştır. FDA'nın ele aldığı sorulara en iyi yaklaşım olmaya devam ettiğinden emin değilim. Öte yandan, FDA olacağını düşündüğüm uygulamaları gördüğümde, yazarların genellikle FDA'nın ne yapmaya çalıştığını gerçekten anlayıp anlamadığını merak ediyorum.


+1. Üzgünüz, cevabınızı sadece şimdi ve sadece şans eseri fark ettim (başka biri burada cevabımın altına bir yorum bıraktı ve aşağı kaydırdım). Katkınız için çok teşekkürler! Bunun hakkında biraz daha fazla okuma yapmak ve çekirdek numarasına benzerlik hakkında söylediklerinizi düşünmek için zaman bulmam gerektiğini düşünüyorum. Kulağa makul geliyor.
amip diyor ki Reinstate Monica

5

FPCA hakkında emin değilim, ancak hatırlanması gereken bir şey, çok yüksek boyutlarda, çok daha fazla "boşluk" olması ve boşluk içindeki noktaların eşit dağılmış görünmeye başlamasıdır (yani her şey diğer her şeyden uzaktır). Bu noktada kovaryans matrisi esasen homojen görünmeye başlayacak ve gürültüye karşı çok hassas olacaktır. Dolayısıyla "gerçek" kovaryansın kötü bir tahmini haline gelir. Belki FPCA bunu bir şekilde halleder, ama emin değilim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.