Bu yanıtın kredisi, yukarıdaki yorumlarda her şeyi açıklayan @ttnphns'a gidiyor. Yine de, genişletilmiş bir cevap vermek istiyorum.
Sorunuza soru: Standart ve standart olmayan özelliklerle ilgili LDA sonuçları tamamen aynı mı olacak? --- cevap Evet . Önce gayri resmi bir argüman vereceğim ve sonra biraz matematikle devam edeceğim.
Bir balonun bir tarafında dağılım grafiği olarak gösterilen 2B veri kümesini düşünün (orijinal balon resmi buradan alınır ):
Burada kırmızı noktalar bir sınıf, yeşil noktalar başka bir sınıf ve siyah çizgi LDA sınıfı sınırdır. Şimdi ölçeklendiriliyorx veya yeksenler balonun yatay veya dikey olarak gerilmesine karşılık gelir. Bu çizginin gerilmesinden sonra siyah çizginin eğimi değişecek olsa da, sınıfların tam olarak eskisi gibi ayrılabileceği ve siyah çizginin göreceli pozisyonunun değişmeyeceği sezgisel olarak açıktır. Her test gözlemi, gerilmeden önceki ile aynı sınıfa atanacaktır. Yani gerilmenin LDA sonuçlarını etkilemediği söylenebilir.
Şimdi, matematiksel olarak, LDA, özvektörlerini hesaplayarak bir dizi ayrımcı eksen bulur W−1B, nerede W ve Bsınıf içi ve sınıflar arası dağılım matrisleridir. Eşdeğer olarak, bunlar genelleştirilmiş özdeğer probleminin genelleştirilmiş özvektörleridirBv=λWv.
Ortalanmış bir veri matrisi düşünün X sütunlardaki değişkenler ve satırlardaki veri noktaları ile, toplam dağılım matrisi şu şekilde verilir: T=X⊤X. Verilerin standartlaştırılması, her bir sütunununXbelirli bir sayıya göre, yani ; burada , ölçekleme katsayılarına (standart sapmaların tersine) sahip çapraz bir matristir her sütun). Böyle bir yeniden ölçeklemeden sonra, dağılım matrisi şu şekilde değişecektir: ve aynı dönüşüm ve .Xn e w= X ΛΛTn e w= Λ T ΛWn e wBn e w
Let orjinal problemin bir özvektör olmak yaniBiz çarpın bu denklem ile ederse solda ve insert önce her iki tarafta , biz elde yani yaniv
B v =λ W v .
ΛΛΛ- 1vΛ B ΛΛ- 1v =λΛ W ΛΛ- 1v ,
Bn e wΛ- 1v =λWn e wΛ- 1v ,
Λ- 1v, eskisi gibi tam olarak aynı özdeğer ile yeniden ölçeklendirildikten sonra bir özvektördür .
λ
Böylece, ayırt edici eksen (özvektör tarafından verilen) değişecektir, ancak sınıfların ne kadar ayrıldığını gösteren özdeğer, tamamen aynı kalacaktır. Ayrıca, başlangıçta tarafından verilen bu eksende izdüşüm şimdi , yani tam olarak aynı kalacaktır (belki bir ölçeklendirme faktörüne kadar).X vX Λ(Λ- 1v )= X v
in general a "Z-score normalization" (or standardization) of features won't be necessary, even if they are measured on completely different scales
Hayır, bu ifade yanlış. LDA ile standardizasyon konusu, çok değişkenli yöntemlerde olduğu gibidir. Örneğin, PCA. Mahalanobis mesafesinin bu konuyla hiçbir ilgisi yoktur.