Kategorik nominal değişkenler arasındaki kategoriler arasındaki ilişki


9

İki kategorik nominal değişkenli bir veri setim var (her ikisi de 5 kategoride). Bu iki değişken arasındaki kategoriler arasındaki potansiyel korelasyonları tespit edip edemediğimi (ve nasıl) tanımak istiyorum.

Başka bir deyişle, örneğin kategori sonuçlarının i değişken 1'de belirli bir kategori ile güçlü bir korelasyon gösterir j 5 kategorili iki değişkenim olduğu için, tüm kategoriler için toplam korelasyon analizi 25 sonuca düşecektir (en azından çalışmasını umduğum / beklediğim şekilde çalışırsa).

Sorunu somut sorulara formüle etmeye çalıştım:

Soru 1: Diyelim ki kategorik değişkeni, değer (kategori) başına 5 farklı kukla değişkene aktarıyorum. Aynı prosedür ikinci değişken için de çalıştırıyorum. Sonra kukla 1.i ve 2.i arasındaki ilişkiyi belirlemek istiyorum (örneğin). Bu prosedürü sıradan bir korelasyon katsayısı prosedürü ile uygulamak benim için istatistiksel olarak doğru mu? Bu prosedürden kaynaklanan korelasyon katsayısı, iki kukla değişken arasındaki korelasyonda uygun bir kavrayış sağlıyor mu?

Soru 2: Birinci soruda açıklanan prosedür geçerli bir prosedürse, bu analizi 2 (veya belki daha fazla) kategorik nominal değişkenin tüm kategorileri için bir kerede yürütmenin bir yolu var mı?

Kullandığım program SPSS (20).


@Michael Mayer tarafından yapılan puanlar gözden geçirilmiş soruya uygulanır.
Nick Cox

1
İki değişken ilişkilendirilmezse, 5x5 frekans matrisinin her hücresinde 1 / 25'e sahip olursunuz. Bu nedenle,χ2 İstatistik xy(OE)2E, nerede E=xyOxy/25 ve Oxy- İki değişkenin 5 değerinden herhangi biri için gözlenen frekans uygun olmalıdır.
Aksakal

3
@Aksakal "İlişkili değil" burada yanlış terimdir; değişkenler nominaldir, bu nedenle korelasyonlar tanımlanmamıştır. Bence bağımsız demek istiyorsun, ama bağımsızlık da eşit frekanslar anlamına gelmiyor. Bağımsızlık altındaki hücre frekansları marjinal frekanslara bağlıdır.
Nick Cox

Yanıtlar:


6

Kategori arasındaki "odak" ilişkisi i bir nominal değişken ve kategori jdiğeri hücrede kalan frekans ile ifade edilirij, bildiğimiz gibi. Artık 0 ise, iki nominal değişken ilişkilendirilmediğinde frekansın beklenen değer olduğu anlamına gelir. Kalıntı ne kadar büyük olursa, aşırı temsil edilen kombinasyon nedeniyle ilişki o kadar büyük olurijörnek. Büyük negatif kalıntı eşdeğer olarak yetersiz temsil edilen kombinasyondan bahseder. Yani, frekans kalıntısı istediğiniz şeydir.

Ham artıklar uygun değildir, çünkü marjinal toplamlara, toplam ve tablo boyutuna bağlıdır: değer hiçbir şekilde standartlaştırılmamıştır. Ancak SPSS, Pearson kalıntıları olarak da adlandırılan standart kalıntıları gösterebilir . St. rezidü, tortunun standart sapmasının bir tahminine bölünmesiyle elde edilir (beklenen değerin sql köküne eşittir). Bir tablonun St. tortuları ortalama 0 ve st. dev. 1 'dir; bu nedenle, st. artık, nicel bir değişkenin dağılımında z değeri gibi bir z değerine hizmet eder (aslında Poisson dağılımında z'dir). St. tortular aynı büyüklükte ve aynı toplamdaki farklı tablolar arasında karşılaştırılabilirN. Bir olasılık tablosunun ki-kare istatistiği , kare şeklindeki st. kalıntıları . Karşılaştırma st. bir tablodaki ve aynı hacimli tablolardaki kalıntılar ki-kare istatistiğine en çok katkıda bulunan belirli hücreleri tanımlamaya yardımcı olur.

SPSS ayrıca ayarlanmış kalıntıları da gösterir (= ayarlanmış standart kalıntılar). Düzeltilmiş. artık, standart hatanın bir tahminine bölünür. İlginç artık sadeceNrij, nerede N genel toplam ve rijkategorilere karşılık gelen kukla değişkenler arasındaki Pearson korelasyonudur (diğer adı Phi korelasyonu)i ve jiki nominal değişkenin. Burtam olarak hesaplamak istediğinizi söylüyorsunuz. Düzeltilmiş. artık doğrudan onunla ilişkilidir.

St aksine. artık rezidüel tablodaki marjinal dağılımlar şekline wrt standardize edilmiştir doğrudan görebilir ve size böylece (o hücrede değil aynı zamanda satır ve onun sütununda dışındaki hücrelerde sadece dikkate beklenen frekansı sürer) gücünü ait kategoriler arasında bağlantı kurmaki ve j- marjinal toplamlarının diğer kategorilere göre büyük veya küçük olup olmadığından endişe etmeden '. Düzeltilmiş. artık z-puanı gibidir, ama şimdi z (normal Poisson değil) dağılımına benzer. Adj. Artık 2'nin üzerinde veya -2'nin altında ise, anlamlı p<0.05düzeyde olduğu sonucuna varabilirsiniz.1. Düzeltilmiş. artıklar halaN; rdeğil, ama tüm alabilirsiniz rdan s kukla değişkenler üretmek için zaman harcamadan, yukarıdaki formülü takip eden kalıntılar.2

İkinci sorunuzla ilgili olarak, yaklaşık 3 yönlü kategori bağları - bu, artıkları da gösteren genel loglinear analizin bir parçası olarak mümkündür. Bununla birlikte, 3 yollu hücre artıklarının pratik kullanımı mütevazıdır: 3 (+) - yol ilişkilendirme önlemleri kolayca standartlaştırılmaz ve kolayca yorumlanamaz.


1St. normal eğri1.962 % 2.5 kuyruk kesme noktasıdır, bu nedenle her iki kuyruğu 2 taraflı alternatif hipotez gibi düşünürseniz% 5'dir.

2 Hücrede ayarlanmış tortunun öneminin ij önemine eşittir rij. Ayrıca, tabloda yalnızca 2 sütun varsa ve aralarındaki oranların z-testini yapıyorsanızPr(i,1) ve Pr(i,2), satır için sütun oranları i, bu testin p değeri her iki (herhangi bir) adj. sıradaki artıklari 2 sütunlu tablo.


1

Burada yaşayan SPSS ile iki değişkenli istatistikler hakkındaki bir belgeden doğrudan alınır :

Ki-kare yararlı bir tekniktir, çünkü iki sıra değişkeni, iki nominal değişken veya bir sıra ve nominal değişken arasında bir ilişki olup olmadığını görmek için kullanabilirsiniz. Sen cihaza bak. Sig sütunu ve .05'den küçükse, iki değişken arasındaki ilişki istatistiksel olarak anlamlıdır.


4
Tamam, ama üç büyük, bir büyük, iki çok küçük. İki sıralı değişken üzerindeki ki-kare sıralamayı yok sayar. Bu SPSS belgesi değil , başkası tarafından temel bir giriş niteliğindedir ve daha önce de belirtildiği gibi aşırı basitleştirir. "Asimp" i kopyalamadılar. doğru şekilde (önceki sayfadaki örnek). OP için en büyük sorun, burada korelasyonun yanlış kelime olmasıdır: "ilişkilendirme", ilişkilendirmeyi ölçme, test etme ve (en iyisi) modelleme açısından anahtar kelimedir.
Nick Cox

1
Teşekkürler, the SPSS documentbiraz düzenledim , niyetime gereksiz bir özgünlük eklemek değildi.
Zhubarb
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.