«mixed-type-data» etiketlenmiş sorular

Farklı ölçüm yapısına sahip değişkenleri içeren veri seti (örn. Sürekli, kategorik, ikili, sayım vb.) Tek bir değişken setinde birlikte analiz edilir. Bu, analiz için bir zorluk oluşturduğunda bu etiketi kullanın. [Karma model] 'e atıfta bulunmak için KULLANMAYIN.

6
Sürekli ve kategorik değişkenlerin karışımını içeren veri setlerine ana bileşen analizi uygulanabilir mi?
Hem sürekli hem de kategorik verileri olan bir veri setine sahibim. PCA kullanarak analiz ediyorum ve kategorik değişkenleri analizin bir parçası olarak dahil etmenin uygun olup olmadığını merak ediyorum. Anladığım kadarıyla PCA sadece sürekli değişkenlere uygulanabilir. Bu doğru mu? Kategorik veriler için kullanılamazsa, analizleri için hangi alternatifler var?

6
Sırasız kategorik değişkenlerle korelasyonlar
Birçok gözlem ve değişken içeren bir veri çerçevem ​​var. Bazıları kategoriktir (sıralanmamış), bazıları sayısaldır. Bu değişkenler arasındaki ilişkileri arıyorum. Sayısal değişkenler için korelasyon hesaplayabildim (Spearman korelasyonu) ama: Sırasız kategorik değişkenler arasındaki ilişkiyi nasıl ölçeceğimi bilmiyorum. Sırasız kategorik değişkenler ile sayısal değişkenler arasındaki ilişkiyi nasıl ölçeceğimi bilmiyorum. Bunun nasıl yapılabileceğini bilen …


2
İkili ve sürekli değişkenleri kümelemede birlikte nasıl kullanırsınız?
K-araçlarında ikili değişkenleri (0 ve 1 değerleri) kullanmam gerekiyor. Ancak k-aracı sadece sürekli değişkenlerle çalışır. Bazı insanların hala bu ikili değişkenleri k-araçlarında k-araçlarının sadece sürekli değişkenler için tasarlandığı gerçeğini göz ardı ederek kullandığını biliyorum. Bu benim için kabul edilemez. Sorular: Öyleyse, k-means / hiyerarşik kümelemede ikili değişkenleri kullanmanın istatistiksel / …

4
Karma veriler neden öklid tabanlı kümeleme algoritmaları için bir sorundur?
Klasik kümeleme ve boyutsallık azaltma algoritmalarının çoğu (hiyerarşik kümeleme, temel bileşen analizi, k-araçları, kendi kendini düzenleyen haritalar ...) özel olarak sayısal veriler için tasarlanmıştır ve girdi verileri bir öklid uzayında noktalar olarak görülür. Bu, elbette bir sorun, çünkü gerçek dünyadaki birçok soru karışık veriler içeriyor: örneğin otobüsleri incelersek, yükseklik ve …

8
Karışık tip verilerin R ile kümelenmesi
Kilitli . Bu soru ve cevapları kilitlidir çünkü soru konu dışıdır ancak tarihsel önemi vardır. Şu anda yeni yanıtları veya etkileşimleri kabul etmiyor. R içinde karışık veri değişkenlerine sahip bir veri kümelenmesi yapmanın mümkün olup olmadığını merak ediyorum. Başka bir deyişle, içinde hem sayısal hem de kategorik değişkenleri içeren bir …


2
Gower mesafesi ikili değişkenler arasındaki farkı nasıl hesaplar?
Veri kümemde 73 örnekle 17 sayısal ve 5 ikili (0-1) değişkenim var. Bir küme analizi yürütmem gerekiyor. Gower mesafesinin karışık değişkenlere sahip veri kümeleri için iyi bir metrik olduğunu biliyorum. Ancak, Gower mesafesinin ikili değişkenler arasındaki farkı nasıl hesapladığını anlayamadım . Bana öyle geliyor ki Öklid mesafesinden farklı değil.

1
R'deki karışık veriler için sağlam küme yöntemi
Küçük bir veri kümesi (4 aralık değişkenleri ve tek bir üç faktörlü kategorik değişken 64 gözlem) küme arıyorum. Şimdi, küme analizinde oldukça yeniyim, ancak hiyerarşik kümelemenin veya k-araçlarının mevcut tek seçenek olduğu günlerden bu yana önemli ilerlemeler olduğunun farkındayım. Özellikle, chl tarafından belirtildiği gibi , "küme veya sınıfların sayısına karar …

1
Karışık sürekli ve ikili değişkenli t-SNE
Şu anda t-SNE kullanarak yüksek boyutlu verilerin görselleştirilmesini araştırıyorum. Karışık ikili ve sürekli değişkenler ile bazı veriler var ve veri ikili verileri çok kolayca küme gibi görünüyor. Tabii ki bu ölçeklenmiş (0 ile 1 arasında) veriler için beklenir: Öklid mesafesi her zaman ikili değişkenler arasında en büyük / en küçük …

1
Ayrık veriler ve PCA'ya alternatifler
Yakın ilişkili birkaç böcek türünde morfolojik kanat karakterlerini tanımlayan ayrık (sıralı, meristik ve nominal) değişkenler veri kümem var. Yapmak istediğim şey, morfolojik özelliklere dayanarak bana farklı türlerin benzerliğinin görsel bir temsilini verecek bir tür analiz yapmak. Kafama gelen ilk şey PCA (bu oluşturmak istediğim görselleştirme türüdür), ancak içine baktıktan sonra …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.