Veri uzayları, değişken uzaylar, gözlem uzayları, model uzayları (örneğin doğrusal regresyonda)


9

Diyelim ki -by- olan veri matrisine ve -by-one olan etiket vektörüne sahibiz . Burada, matrisin her satırı bir gözlemdir ve her sütun bir boyuta / değişkene karşılık gelir. ( olduğunu varsayın )XnpYnn>p

Sonra ne mi data space, variable space, observation space, model spacedemek?

Sütun vektörü tarafından yayılan boşluk, sıralaması) iken koordinatlarına sahip olduğu için (dejenere edilmiş) -D alanı mıdır, değişken-vektör tarafından yayıldığı için değişken alan olarak adlandırılır mı? Yoksa her boyut / koordinat bir gözleme karşılık geldiğinden gözlem alanı olarak mı adlandırılır?nnp

Peki ya sıra vektörlerinin yaydığı alan?


5
Bunlar evrensel olarak bilinen terimler değildir. Referansınız var mı? Değilse, ne anlama geldiklerini tahmin ediyor olabiliriz.
whuber

1
Referansım yok. Bir keresinde profesörümün bir süre önce söylediğini duydum.
user3813057

3
O halde, profesörünüzün bu terimleri bir noktada tanımladığından eminim. Belki de ders notundadırlar.
whuber

Yanıtlar:


14

Bu terimler çok değişkenli istatistiklerle ilgili bazı kitaplarda yer almaktadır. Diyelim ki niceliksel özellikler veri matrisine ngöre bireyleriniz var p. Daha sonra bireyleri, eksenlerin özellik olduğu boşlukta noktalar olarak çizebilirsiniz. Bu klasik dağılım grafiği , diğer bir deyişle değişken uzay grafiği. Diyoruz ki, bireyler bulutu eksenler-özelliklerle tanımlanan alana yayılmıştır .

Dağılım grafiğini, değişkenler ve eksenler bireyler olmak üzere düşünebilirsiniz. Kesinlikle önceki gibi, sadece topsy-turvy. Bu, onu kapsayan değişkenler, bireyleri tanımlayan konu alanı çizimi (veya gözlem alanı grafiği) olacaktır.

O zaman (sık sık) n>p, ikinci durumda, sadece pboyutların dışındaki bazı boyutların ngereksiz olmadığını unutmayın; Bu p, pboyutsal çizim üzerinde değişken noktaları çizebileceğiniz ve çizebileceğiniz anlamına gelir . Ayrıca, geleneklere göre değişken noktalar genellikle başlangıç ​​noktasıyla bağlantılıdır ve bu nedenle vektörler (oklar) olarak görünürler. Konu alanı temsilini çoğunlukla değişkenler arasındaki ilişkileri göstermek için kullanırız, bu nedenle kolaylık sağlamak için eksen konularını bırakır ve noktaları oklar olarak tasvir ederiz.1

Özneler (veri matrisinin sütunları) özne alanı grafiği çizilmeden önce ortalandıysa, değişken vektörler arasındaki açıların kosinüsleri Pearson korelasyonlarına eşit olurken, vektör uzunlukları değişkenlerin normlarına (karelerin kök toplamı) eşittir ) veya standart sapmalar ( df'ye bölünmüşse ).

Değişken uzay ve özne alanı aynı madalyonun iki yüzüdür, aynı Öklid analitik uzaydır, sadece birbirlerine ayna gibi sunulurlar. Sıfır olmayan özdeğerler ve özvektörler gibi aynı özellikleri paylaşırlar. Bu nedenle, hem özneleri hem de değişkenleri , bu analitik boşluğun ana eksenlerinin (veya başka bir dikey temelde) uzayda noktalar olarak yan yana çizmek mümkündür - bu eklem grafiğine biplot denir . "Veri alanı" teriminin tam olarak ne anlama geldiğini bilmiyorum - eğer spesifik bir şey ifade ediyorsa, o zaman konu ve değişken alanın iki hipostaz olduğu ortak analitik alan olduğunu varsayalım.

resim açıklamasını buraya girin

Bazı yerel bağlantılar:


1n=5Bireyleriniz ve p=2değişkenleriniz olduğunu ve bir şekilde sihirli bir şekilde 5 boyutlu uzayda 2 nokta çizmeyi başardığınızı hayal edin . Daha sonra eksenlerden herhangi biri tarafından tanımlanan alt boşluğu 2 noktayı gömecek şekilde döndürebilirsiniz (böylece bu düzlem bundan sonra uzanır); bundan sonra, gereksiz olduklarından diğer 3 ekseni (boyutlar) güvenli bir şekilde düşürürsünüz. İki değişken noktanın birbirine göre konumu korunmuştur.


2
+1. Fakat değişken ve özne alanının “aynı Öklid analitik alanı” olduğunu söylemenin tam matematiksel anlamının ne olduğundan emin değilim.
amip

3
@amoeba, Cevapta matematiksel olmadan sezgisel olarak şeffaf olmasını umdum (özellikle sizin gibi lineer cebir uzmanları için). Örneğin, veri matrisinin tekil değer ayrışmasında (biplotun dayandığı svd) - özdeğerler ve sol ve sağ özvektörler hangi alanı karakterize eder? Çeşitli şekillerde ortaya konabilen aynı analitik alan değil mi - bunlar arasında (i) eksenler olarak ana eksenlerin nokta olarak sıra ve sütunlar; (ii) satırlar halinde sütunlar halinde eksen olarak satırlar; (iii) sütun olarak satırlara göre eksen olarak mı?
ttnphns
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.