Değişken grupları arasındaki / içindeki korelasyon nasıl hesaplanır?


13

1000 gözlem matrisim ve her biri 5 puanlık bir ölçekte ölçülen 50 değişkenim var. Bu değişkenler gruplar halinde düzenlenmiştir, ancak her grupta eşit sayıda değişken yoktur.

İki tür korelasyonu hesaplamak istiyorum:

  1. Değişken grupları içindeki korelasyon (özellikler arasında): Değişken grubundaki değişkenlerin aynı şeyi ölçüp ölçmediğine dair bir ölçüm.
  2. Değişken grupları arasındaki korelasyon: her bir grubun bir genel özelliği yansıttığı varsayılarak, her özelliğin (grup) diğer özelliklerle nasıl ilişkili olduğu konusunda bir ölçüt.

Bu özellikler daha önce gruplara ayrılmıştır. Gruplar arasındaki korelasyonu bulmakla ilgileniyorum - yani, grup içindeki özelliklerin aynı temel özelliği ölçtüğünü varsayarak (yukarıda # 1'i tamamladıktan sonra - Cronbach's alpha), özelliklerin kendileriyle ilişkili mi?

Nereden başlayacağınız konusunda önerisi olan var mı?


1
R'ye aşina iseniz, veya tercihen (permütasyonel MANOVA) veganişlevlere sahip bir paket vardır . anosimadonis
Roman Luštrik

Standart terminolojiyi kullanmaya çalışmak için sorunuzu güncelledim (yani, özellikler değil değişkenler; "gruplar" yerine değişken grupları)
Jeromy Anglim

Yanıtlar:


16

@Rolando tarafından önerilen, yanıtın tamamı olmasa da (IMO) iyi bir başlangıç ​​gibi görünüyor. Klasik Test Teorisi (CTT) çerçevesini izleyerek korelasyonel yaklaşıma devam edeyim. Burada, @Jeromy tarafından belirtildiği gibi, özellik grubunuz için özet bir ölçü, şimdi ölçek olarak anlatacağım şeye ait tüm öğelerin (kelimelerinizde bir karakteristik) toplam (veya toplam) puanı olarak düşünülebilir. CTT'ye göre bu, bireysel "özellik" eğilimini veya yükümlülüğünü, temelde bir yapıyı (gizli bir özelliği) yansıtan sürekli bir ölçekte konumu olarak resmileştirmemize izin verir, ancak burada sadece sıralı bir ölçekdir (ancak psikometri literatüründeki bu başka bir tartışma). .

Ne açıklandığı gibi biliyor ne ilgisi var yakınsak ve (aynı ölçek ait ölçüde ürün korelatı birbiriyle birini ne kadar) diskriminant Psikometrinin geçerlilik (should büyük ölçüde korelatı değil farklı ölçeklerde ait öğeleri). Klasik teknikler arasında çok özellikli çok yöntemli (MTMM) analizler bulunmaktadır (Campbell & Fiske, 1959). Nasıl çalıştığının bir örneği aşağıda gösterilmiştir (üç yöntem veya araç, üç yapı veya özellik):

resim açıklamasını buraya girin

>0.7<.3

Bu yöntem başlangıçta, farklı ölçüm cihazları tarafından incelenen belirli sayıda özelliğin yakınsak ve ayırt edici geçerliliğini değerlendirmek için geliştirilmiş olsa da, tek bir çok ölçekli alet için uygulanabilir. Özellikler daha sonra öğeler haline gelir ve yöntemler sadece farklı ölçeklerdir. Bu yöntemin tek bir cihaza genelleştirilmesi, çok noktalı ölçekleme olarak da bilinir . Beklendiği gibi ilişkilendirilen kalemler (farklı bir ölçek yerine kendi ölçekleriyle) ölçekleme başarısı olarak sayılır. Bununla birlikte, genellikle, farklı ölçeklerin birbiriyle ilişkili olmadığını, yani farklı varsayımsal yapıları hedeflediklerini varsayıyoruz. Ancak ölçek içi ve ölçekler arası korelasyonların ortalaması, enstrümanınızın iç yapısını özetlemenin hızlı bir yoludur. Bunu yapmanın bir başka uygun yolu, ikili korelasyonlar matrisine bir küme analizi uygulamak ve değişkenlerinizin nasıl birbirine asıldığını görmektir.

Her iki durumda da, korelasyon önlemleri ile çalışma olağan uyarıları geçerlidir, yani ölçüm hatasını açıklayamazsınız, büyük bir örneğe ihtiyacınız vardır, enstrümanlar veya testlerin "paralel" olduğu varsayılır (tau-denklik, ilişkisiz hatalar, eşit hata varyansları).

@Rolando tarafından ele alınan ikinci bölüm de ilgi çekicidir: Önceden oluşturulmuş öğe grubunun anlamlı olduğuna dair teorik veya somut bir gösterge yoksa, verilerinizin yapısını örneğin keşifsel faktör analizi ile vurgulamanın bir yolunu bulmanız gerekecektir. . Ancak bu "grup içindeki özelliklere" güveniyor olsanız bile, bunun geçerli bir varsayım olduğunu kontrol edebilirsiniz. Şimdi, öğe yüklemelerinin deseninin (bir öğenin kendi ölçeğiyle korelasyonu) beklendiği gibi davrandığını kontrol etmek için doğrulayıcı faktör analizi modeli kullanıyor olabilirsiniz.

Geleneksel faktör analizi yöntemleri yerine, öğeleri homojen ölçeklerde gruplamak için Cronbach'ın alfa tabanlı bölünmüş kuralına dayanan öğe kümelemesine de (Revelle, 1979) bir göz atabilirsiniz.

Son bir kelime: R kullanıyorsanız, yukarıda belirtilen adımları kolaylaştıracak iki çok güzel paket var:

  • psikolojik , sen Psikometri faktör analizi dahil yöntemlerle (başlangıç yapmak için gereken her şeyi size sunar fa, fa.parallel, principal), öğeleri kümeleme ( ICLUSTve ilgili yöntemleri), Cronbach alfa ( alpha); William Revelle'nin web sitesinde hoş bir genel bakış var, özellikle R'deki uygulamalarla psikometrik teoriye giriş .
  • psy , ayrıca scree plot (PCA + simüle veri kümeleri aracılığıyla) görselleştirme ( scree.plot) ve MTMM ( mtmm) içerir.

Referanslar

  1. Campbell, DT ve Fiske, DW (1959). Çok bölgeli-multimetod matrisi ile yakınsak ve ayırt edici doğrulama. Psikolojik Bülten , 56: 81-105.
  2. Hays, RD ve Fayers, P. (2005). Çok maddeli ölçeklerin değerlendirilmesi. Olarak klinik çalışmalarda yaşam kalitesinin değerlendirilmesi , s. 41-53, (Fayers, S., Hays, R., ed.). Oxford.
  3. Revelle, W. (1979). Hiyerarşik Küme Analizi ve Testlerin İç Yapısı. Çok Değişkenli Davranışsal Araştırma , 14: 57-74.

Bu belki de Borsaların herhangi birinde okuduğum en ilginç cevap ve 5 yıldır ekonometri okuyorum.
d8aninja

Burada bulunan MTMM matrisinin, bir korelasyon matrisinin gerçekçi bir örneği olması gerekiyor mu? Eğer öyleyse, bunun aslında olumlu bir semidefinite matrisi olmadığını not edeceğim: örneğin, 1,2, yöntem 1,2 arasındaki korelasyonlar için 4'e 4 minör -0.0419179 belirleyicisine sahiptir. (Bu küçük bir negatif değer olduğu için, bu belki de sadece `` ölçüm hatası '' anlamına gelir.)
Semiclassical

7

Terminolojinizi okuma şeklim, istediğiniz her şeyden önce her bir değişken grubundaki iç tutarlılığı ve sonra da her bir değişken grubunun ortalamasını oluşturan ölçek puanları arasındaki korelasyonları değerlendirmektir. Birincisi Cronbach alfa, ikincisi Pearson korelasyonu kullanılarak yapılabilir. Bu, oldukça normal dağılımlara ve makul derecede doğrusal ilişkilere sahip olduğunuzu varsayar.

Daha gerekli olan ve zorunlu olarak gerekli olmayan bir yöntem, keşifsel bir faktör analizi yapmak olacaktır. Hangi değişkenlerin birlikte gruplandırılması gerektiğini ve sonra yine bu faktörlerin ne derece ilişkilendirileceğini belirlemeye çalışacaksınız. Bu yöntemi denerseniz, bu korelasyonların görünmesine izin vermek için eğik döndürmeyi kullandığınızdan emin olun. Ana bileşenlerin çıkarılmasını veya ana eksen çıkarmanın kullanılıp kullanılmadığı, sırasıyla değişkenlerinizin objektif, hatasız ölçümlere veya belirli miktarda hata içeren anket öğeleri gibi öznel olanlara bağlı olmasına bağlı olacaktır.


Yanıtınız için teşekkürler. Cronbach'ın alfa değerini hesaplamayı başardım, ancak bu durumda Pearson korelasyon katsayılarını nasıl hesaplayabilirim? Her bir karakteristik için bunları ikili bir şekilde hesaplayabilirim, ancak karakteristik gruplar arasındaki korelasyonların nasıl hesaplanacağını bilmek istiyorum. Bir grup içindeki özellikler her gözlem için benzer puanlara sahip olacaktır. Bunu biraz daha açık hale getirmek için sorumu düzenleyeceğim.
blep

5
  • Durumunuzdaki en azından psikolojideki standart araçlar, faktörler ve öğeler arasındaki ilişkinin önerilen bazı modeliyle öğeler arası korelasyon matrisinin yakınsamasını değerlendirmek için keşif ve doğrulayıcı faktör analizi olacaktır. Sorunuzu ifade etme şekliniz, bu literatüre aşina olmayabileceğinizi gösterir. Örneğin, ölçek yapısı ve faktör analizi ile ilgili notlarım ve burada R-faktör analizi formu Quick-R hakkında bir öğretici var . Bu nedenle, özel sorunuza cevap vermeye değer olsa da, çok öğeli, çok faktörlü ölçekleri değerlendirmek için faktör analitik yaklaşımları inceleyerek daha geniş hedeflerinize daha iyi hizmet edileceğini düşünüyorum.

  • Başka bir standart strateji, her değişken grubu için toplam puanları hesaplamak ("ölçek" dediğim) ve ölçekleri ilişkilendirmektir.

  • Birçok güvenilirlik analiz aracı, ortalama öğeler arası korelasyonu rapor edecektir.

  • Öğeler arasında 50 x 50 korelasyon matrisini oluşturduysanız, R'ye değişken gruplarının kombinasyonlarına göre alt kümelerin ortalamasını alan bir işlev yazabilirsiniz. Olumlu ve negatif öğelerin bir karışımına sahipseniz, negatif korelasyonlar pozitif korelasyonları iptal edebileceğinden, istediğinizi alamayabilirsiniz.


2

Yalnızca çiftler için tanımlanan korelasyon kavramının, Gauss modellerine karşılıklı bilgi ve entegrasyon kavramının yerine geçmesini öneririm.

G1

I1log(|C1|)

C1G1G1log(1ρ2)ρ

İki değişken grubu arasındaki etkileşimi hesaplamak için, gruplar arasında sadece çapraz entropi olan karşılıklı bilgileri kullanabilirsiniz:

MU12=I12I1I2

Ben yardımcı olabilir hızlı bir google sonra bu kavramlar bir referans buldum .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.