Aykırı algılama için sağlam PCA ve sağlam Mahalanobis mesafesi


17

Sağlam PCA ( Candes ve ark 2009 veya daha iyisi henüz Netrepalli ve ark 2014 tarafından geliştirilen ), çok değişkenli aykırı değer tespiti için popüler bir yöntemdir , ancak Mahalanobis mesafesi , kovaryans matrisinin sağlam ve düzenli bir tahmini verildiğinde aykırı tespiti için de kullanılabilir . Bir yöntemi diğerine göre (dis) avantajlarını merak ediyorum.

Sezgim, ikisi arasındaki en büyük farkın şu olduğunu söylüyor: Veri kümesi "küçük" (istatistiksel anlamda) olduğunda, sağlam PCA daha düşük seviyeli bir kovaryans verirken, sağlam kovaryans matris kestirimi bunun yerine tam bir Ledoit-Wolf düzenlenmesi nedeniyle rütbe kovaryansı. Bu durum, aykırı algılamayı nasıl etkiler?


İlginç bir soru ama belirli bir kullanım durumu olmadan bir cevabın nasıl motive edilebileceğini göremiyorum. Mı var "fena halde gözlemleri bozuk" ? Genel olarak gürültülü verileriniz var mı? Bazı RPCA uygulamaları esasen PC'lerin kovaryansın düzenli tahmininden tahmin edildiği güçlü kovaryans tahmin teknikleridir (bkz. Jolliffe'in Princ. Bileşen Analizi, Ed. 2. Bölüm 10). Bu nedenle, bahsettiğiniz iki yaklaşımdan farklılıklar kesin değildir. Genel olarak, otomatik aykırı değer tespiti belirli bir uygulama bağlamında başarılı olur.
usεr11852 diyor Reinstate Monic

1
“Gürültülü veri” problemi daha belirgin bir algılama değildir. Aykırı algılama sorunu, bu iki yöntem arasında bir kullanım durumu olmadan genel bir karşılaştırma yapılmasına izin verecek kadar kendi başına yeterli kısıtlayıcı olduğunu düşünüyorum. Bu metodoloji hakkında bir soru.
Mustafa S Eisa

Belki çok az alanda çok fazla şey söylemeye çalıştım, bunun için üzgünüm. Dikkat çekmek istediğim, bahsettiğiniz iki yaklaşımın farklı olmaması. Bir projeksiyon arayışı yaklaşımı (RPCA olarak adlandırdığınız şey) ve sağlam bir kovaryans tahmin yaklaşımı (Mahalanobis mesafeleri olarak adlandırdığınız) arasındaki karşılaştırmaya odaklanmayı düşünmelisiniz. Kendi başına sağlam kovaryans tahmini, RPCA uygulamaları için mükemmel geçerli bir metodolojidir (örn. Google "PCA M-Tahmini"). RPCA bağlamında bir şekilde bahsetmediğiniz ağırlıklı PCA yaklaşımlarının varlığından da bahsetmiyoruz.
usεr11852 diyor Reinstate Monic

Özür dilemeye gerek yok :) İki yöntem özellikle küçük veri kümelerinde çok farklıdır. Farklı olma yollarından biri sorumun sonunda belirtiliyor. (Sağlam) PCA bir projeksiyon problemi olarak görülebilse de, aynı zamanda bir kovaryans tahmin problemi olarak da yorumlanabilir, bu yüzden belki de parametre tahmin yönteminde uygulama ve performanstan daha az bir fark vardır.
Mustafa S Eisa

@ MustafaSEisa / Güzel soru! Bence metodolojik gerekçelerle cevaplanabilir: aslında pete peelinglerimden biri. En kısa sürede belirsiz bir cevap vermeye çalışacağım. Bu arada; Bence ona daha genel anlamda yaklaşmanın verimli bir yolu, iç içe geçmiş ama eşit olmayan bir değişmezlik grubuna sahip modelleri kullanmanın sonuçlarına bakmaktır. Burada biraz farklı bir bağlamda yapmaya çalışıyorum .
user603

Yanıtlar:


7

Bu makale bu alandaki bazı yöntemleri karşılaştırmaktadır. "PCP" (temel bileşen takibi) olarak bağladığınız Sağlam PCA yaklaşımını ve M-tahmincisi olarak sağlam kovaryans tahmini için bağlandığınız yöntem ailesini ifade ederler.

İddia ediyorlar

PCP, bozuk veri noktaları (yani aykırı değerler) yerine eşit olarak bozuk veri koordinatları için tasarlanmıştır, bu nedenle, PCP ile karşılaştırma bu tür veriler için biraz haksızdır

ve PCP'nin (sağlam PCA olarak da bilinir) bazı durumlarda aykırı algılama için başarısız olabileceğini gösterir.

Ayrıca, üç çeşit "altuzayın kurtarılması düşmanı", yani farklı aykırı değerler ve her biri ile başa çıkmak için hangi tür yöntemlerin iyi sonuç verebileceği hakkında da konuşurlar. Kendi aykırı değerlerinizi burada tartışılan üç çeşit "düşman" ile karşılaştırmak, bir yaklaşım seçmenize yardımcı olabilir.


Bu David için teşekkürler, gazeteye bir göz atacağım. Bununla birlikte, koordinatlara bir ceza (Candes vakasında olduğu gibi) yerine veriye (veri matrisinin satırları) dönme ile değişmeyen bir ceza uygulayan sağlam bir PCA sürümü vardır. Düşünceler?
Mustafa S Eisa

Sorunu anladığımdan emin değilim. Sorunuzda tartıştığınız iki yaklaşımı farklı bir sağlam PCA yaklaşımıyla karşılaştırmamı mı istiyorsun?
David J. Harris

11

Cevabınız “Hayır” ise, bu tamamen iyi, sadece merak ediyorum.
Mustafa S Eisa

Ah anlıyorum. Bu Mahalanobis mesafesinin özel bir durumu olabilir mi?
David J. Harris
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.