Hiyerarşik bir küme analizinin dendrogramı nasıl yorumlanır?


25

Aşağıdaki R örneğini düşünün:

plot( hclust(dist(USArrests), "ave") )
  1. Y ekseni "Yükseklik" tam olarak ne anlama geliyor?

  2. Kuzey Carolina ve Kaliforniya'ya bakmak (sol tarafta). Kaliforniya, Kuzey Carolina’ya Arizona’dan daha yakın mı? Bu yorumu yapabilir miyim?

  3. Hawaii (sağda) kümeye oldukça geç katılıyor. Bunu diğer devletlerden daha "yüksek" olarak görebiliyorum. Genel olarak dendrogramda etiketlerin "daha yüksek" veya "daha düşük" olduğu gerçeğini nasıl doğru yorumlayabilirim?

görüntü tanımını buraya girin


1
İçinde Cevapları ?hclust.
Scortchi - Eski Monica

3
Etiketlerin konumlarının hiçbir anlamı yoktur. Y eksenini anlamıyorsanız, hiyerarşik kümelemeyi iyi anlamak için izleniminiz altında olmanız garip.
Stéphane Laurent

1
Lütfen hiyerarşik kümelemenin genellikle size hiyerarşik (ağaç) sınıflandırma yapmadığını unutmayın . Özellikle kullandığınız ortalama yöntem yok. Buradaki son noktaya bakın .
ttnphns

1
Bir etiketin pozisyonunun küçük bir anlamı olsa da. Konum ne kadar yüksek olursa, nesne o zaman diğerleriyle bağlantı kurar ve bu nedenle daha çok bir dışlayıcı veya başıboş olandır.
ttnphns

3
@ StéphaneLaurent Bu sesin bir çelişki gibi geldiği konusunda haklısın. Orada hala iyi bildiğim bir dendogram veriyi arayabildiğimi düşünüyorum. Ayrıca, etiketlerin pozisyonunun ttnphns ve Peter Flom'un işaret ettiği gibi küçük bir anlamı vardır. Sonunda yorumunuz bana yapıcı değildi.
Ric

Yanıtlar:


17

1) Y ekseni, tek tek veri noktalarının veya kümelerin yakınlığının bir ölçüsüdür.

2) California ve Arizona Florida'dan eşit derecede uzaktır çünkü CA ve AZ, FL'a katılmadan önce bir kümededir.

3) Hawaii oldukça geç katılıyor; Bu, birleştirdiği kümenin HI birleşmeden önce birbirine daha yakın olduğu anlamına gelir. Ama daha yakın değil. Birleştirdiği kümenin (sağ taraftaki tüm yol) yalnızca yaklaşık 45 değerinde olduğuna dikkat edin. herhangi bir özel durum.


Böylece "yükseklik" bana bağlantı kriterinin değeri ( burada olduğu gibi ) - benim durumumda kümelerin birbirine olan ortalama mesafesi hakkında bir fikir veriyor . Bu doğru mu? Teşekkürler!
Ric

Y-ekseni bir ölçüsü değil dis kümeleri ve nokta arasındaki benzerlik? Şeyler çoğu farklı değil @PeterFlom tersi olduğunda o büyük çünkü Yani negatif yakınlık,
Felipe Almeida

21

Hiyerarşik kümelemeyi öğrenmeyi denediğimde de aynı soruları aldım ve aşağıdaki pdf dosyasını çok yararlı buldum.

http://www.econ.upf.edu/~michael/stanford/maeb7.pdf

Richard, prosedür hakkında zaten net olsa bile, soruyu araştıranlar muhtemelen, yeterince matematik geçmişi olmayanlar için çok basit ve net bir şekilde olan pdf'yi kullanabilirler.


3
Sadece bağlantılı pdf'nin çok iyi olduğunu tekrarlamak istiyorum.
Heisenberg,

Kaynak: Klimberg, Ronald K. ve BD McCullough. 2013. “Bölüm 7: Hiyerarşik Küme Analizi.” JMP ile öngörü tahmininin temelleri. Cary, NC: SAS Enstitüsü.
jay.sf

1

Yatay eksen kümeleri temsil eder. Dendrogramdaki dikey ölçek, mesafeyi veya farklılığı temsil eder. İki kümenin her birleşmesi (füzyon), bir dikey çizginin iki dikey çizgiye bölünmesiyle diyagramda temsil edilir. Kısa bir çubukla gösterilen bölmenin dikey konumu, iki küme arasındaki mesafeyi (farklılığı) verir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.