Sorunumun cevabını bulmaya çalışırken bu sitedeki tüm sayfaları zaten okudum ama kimse bana doğru olan gibi görünmüyor ...
Öncelikle size birlikte çalıştığım veri türlerini açıklıyorum ...
300 kullanıcının her biri için bir tane olmak üzere çeşitli şehir adlarına sahip bir dizi vektörüm olduğunu varsayalım. Ayrıca her kullanıcının anketine veya her kullanıcı için sürekli bir değere yanıt veren başka bir dizi vektörü var.
Nominal ve sayısal / sürekli veya sıralı değişkenler arasındaki bu iki değişken arasındaki korelasyonu hesaplayan bir korelasyon katsayısı olup olmadığını bilmek istiyorum.
İnternette arama yaptım ve bazı sayfalarda beklenmedik durum katsayısını veya Cramer'in V veya Lambda katsayısını veya Eta'yı kullanmanızı öneririm. Bu önlemin her biri için, nominal değişken ve aralık veya sayısal değişkene sahip olduğumuz bu tür veriler için uygulanabileceğini söyleyin. Mesele şu ki, arama ve arama, her birini anlamaya çalışmak, bazen yazılır veya iki değerli nominal değişkeniniz varsa bunları kullanmak için makul oldukları örnekleri izler, Cramer's V hariç, diğer zaman için herhangi bir gereklilik yazılmaz veri türü. Diğer birçok sayfa bunun yerine regresyon uygulamak için doğru olduğunu söylüyor, bu doğru, ama sadece bu tür veriler için pearson / spearman gibi bir katsayı olup olmadığını bilmek istiyorum.
Ben de bunun şehirler sıralanabilir olmadığı için Spearman Korelasyon katsayısını kullanmanın uygun olmadığını düşünüyorum.
Ayrıca Cramer'sV ve Eta işlevini kendim inşa ettim (Matlab ile çalışıyorum) ama Eta için katsayının istatistiksel olarak önemli olup olmadığını görmek için herhangi bir p değeri hakkında konuşmuyorlar ...
MatlabWorks sitesinde eta ^ 2 hesapladığını söyleyen güzel bir araç kutusu da var, ancak ihtiyaç duyduğu girdi türü anlaşılabilir değil.
Burada benimki gibi bir test yapan biri var mı? Kullandığım veri türünü anlamak için daha fazla ayrıntıya ihtiyacınız varsa, bana sormanız yeterli, size daha iyi açıklamaya çalışacağım.