Doğrusal diskriminant analizi boyutları nasıl azaltır?


18

"İstatistiksel Öğrenmenin Unsurları" sayfa 91'den kelimeler var:

P-boyutlu giriş uzayındaki K sentroidleri çoğu K-1 boyutlu alt uzayda uzanır ve p, K'den çok daha büyükse, bu boyutta önemli bir düşüş olacaktır.

İki sorum var:

  1. Neden p-boyutlu girdi uzayındaki K sentroidleri en çok K-1 boyutlu altuzada yayılır?
  2. K sentroidleri nasıl bulunur?

Kitapta bir açıklama yok ve ilgili makalelerden cevap bulamadım.


3
sentroidler en çok bir yalan boyutlu afin bölme odası. Örneğin, bir çizgi üzerinde iki nokta, boyutlu bir altuzay bulunur. Bu sadece bir afin altuzayının ve bazı temel lineer cebirin tanımıdır. KK-12-1
deinst

Yanıtlar:


16

Diskriminantlar sınıfları en güçlü şekilde ayıran eksenler ve gizli değişkenlerdir. Olası ayrımcıların sayısı . Örneğin, p = 2 boyutlu uzayda k = 3 sınıfla, aşağıdaki grafikte olduğu gibi en fazla 2 ayrımcı olabilir. (Ayrımcıların orijinal alanda çizilen eksenler olarak dik olması gerekmediğine dikkat edin, ancak değişken olarak birbirleriyle ilişkisizdir.) Sınıfların sentroidleri, ayrımcı alt yüzeylere dik koordinatlarına göre ayrımcı altuzay içinde bulunur.mbenn(k-1,p)

resim açıklamasını buraya girin

Ekstraksiyon aşamasında LDA cebiri burada .


Güzel bir grafik, oluşturmak için hangi yazılımı / paketi kullandınız?
Michelle

SPSS. SPSS için kendi kendine yazılan makro.
ttnphns

Bu, ekseni yeniden ölçeklendirene kadar bir LDA'da üst üste binmiş üç sınıfla iyi bir sınıf ayrımı görmeyeceğiniz anlamına mı geliyor? Demek istediğim, bir LDA kullanıyorum ve sınıflarım ayrılıyor ... ama birincisi hariç her ayrım ekseninde birbirlerinin üstünde ... ve bu çok büyük.
donlan

14

"İstatistiksel Öğrenmenin Unsurları" parlak bir kitap olsa da, ondan en iyi şekilde yararlanmak için nispeten yüksek düzeyde bilgi gerektirir. Web'de, kitaptaki konuları anlamanıza yardımcı olacak başka birçok kaynak vardır.

İki boyutlu veri noktası kümesini K = 2 gruplarına gruplamak istediğiniz çok basit doğrusal ayırıcı analiz örneğini ele alalım. Boyutlardaki düşüş sadece K-1 = 2-1 = 1 olacaktır. @Deinst'in açıkladığı gibi, boyutlardaki düşüş temel geometri ile açıklanabilir.

Herhangi bir boyuttaki iki nokta bir çizgi ile birleştirilebilir ve çizgi bir boyutludur. Bu bir K-1 = 2-1 = 1 boyutlu altuzayın bir örneğidir.

Şimdi, bu basit örnekte, veri noktaları kümesi iki boyutlu uzaya dağıtılacaktır. Noktalar (x, y) ile temsil edilir, örneğin (1,2), (2,1), (9,10), (13,13) gibi veri noktalarınız olabilir. Şimdi, iki A ve B grubu oluşturmak için lineer diskriminant analizinin kullanılması, veri noktalarının, belirli özelliklerin karşılanması için A grubuna veya B grubuna ait olarak sınıflandırılmasına neden olacaktır. Doğrusal diskriminant analizi, gruplar arasındaki varyansı, gruplar içindeki varyansa kıyasla maksimize etmeye çalışır.

Başka bir deyişle, A ve B grupları birbirinden çok uzak olacak ve birbirine yakın veri noktaları içerecektir. Bu basit örnekte, noktaların aşağıdaki gibi gruplandırılacağı açıktır. A Grubu = {(1,2), (2,1)} ve B Grubu = {(9,10), (13,13)}.

Şimdi, sentroidler veri noktası gruplarının sentroidleri olarak hesaplanır.

Centroid of group A = ((1+2)/2, (2+1)/2) = (1.5,1.5) 

Centroid of group B = ((9+13)/2, (10+13)/2) = (11,11.5)

Centroidler basitçe 2 puntodur ve onları birleştiren 1 boyutlu bir çizgiyi kapsarlar.

Şekil 1

Doğrusal diskriminant analizi, iki veri noktası grubunun "olabildiğince ayrılması" için bir satırdaki veri noktalarının bir yansıması olarak düşünebilirsiniz.

Üç grubunuz varsa (ve üç boyutlu veri noktaları söylüyorsanız), üç sentroid alırsınız, sadece üç nokta ve 3D uzaydaki üç nokta iki boyutlu bir düzlem tanımlar. Yine K-1 = 3-1 = 2 boyut kuralı.

Web'de, verdiğim basit tanıtımı açıklamaya ve genişletmeye yardımcı olacak kaynakları aramanızı öneririm; örneğin http://www.music.mcgill.ca/~ich/classes/mumt611_07/classifiers/lda_theory.pdf


1
Sitemize Hoşgeldiniz, Martino!
whuber

teşekkürler @whuber, güzel grafik, elimde böyle bir araç yoktu :(
martino

Yine de bir görüntü yayınlamak için bir üne sahip olduğunu düşünmemiştim Martino: bu yüzden senin için bir tane yaptım. Ama şimdi - ya da yakında - yeterli temsilciniz olacak. Hiçbir şey kullanışlı değilse, R veya Geogebra gibi geometrik çizim yeteneklerine sahip serbestçe bulunan yazılımları kullanabilirsiniz . ( Resimli yanıtların daha fazla dikkat çektiğini göreceksiniz : daha çekici ve okunabilir.)
whuber

Neden inişli çıkışlı? Cevabı olan bir sorun varsa, bunu belirtmek yararlı olacaktır - bir tane göremiyorum
martino
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.