Arsa 1 için basit bir korelasyon yaparak x ve y arasındaki ilişkiyi test edebilirim.
İlişkinin doğrusal olmadığı ancak x ile y arasında net bir ilişki olan arsa 2 için, ilişkiyi nasıl test edebilir ve doğasını etiketleyebilirim?
Arsa 1 için basit bir korelasyon yaparak x ve y arasındaki ilişkiyi test edebilirim.
İlişkinin doğrusal olmadığı ancak x ile y arasında net bir ilişki olan arsa 2 için, ilişkiyi nasıl test edebilir ve doğasını etiketleyebilirim?
Yanıtlar:
... ilişki doğrusal değildir, ancak x ve y arasında açık bir ilişki vardır, ilişkiyi nasıl test edebilir ve doğasını etiketleyebilirim?
Bunu yapmanın bir yolu, örneğin genelleştirilmiş bir katkı modeli kullanarak yarı parametrik olarak tahmin edilen bir fonksiyonu olarak sığdırmak ve bu fonksiyonel tahminin sabit olup olmadığını test etmek ve ile arasında bir ilişki olmadığını göstermesidir . Bu yaklaşım sizi polinom regresyonu yapmaktan ve bazen polinomun sırası hakkında keyfi kararlar almaktan kurtarır.x y x
Özellikle, gözlemleriniz varsa, , modele uyabilirsin:
ve hipotezini test edin . Bunu , işlevi kullanarak yapabilirsiniz . Eğer sonucunuz ve tahmininiz ise, şunu yazabilirsiniz:R
gam()
y
x
library(mgcv)
g <- gam(y ~ s(x))
Yazma summary(g)
, yukarıdaki hipotez testinin sonucunu size verecektir. İlişkinin niteliğini nitelemekle birlikte, bu en iyi şekilde bir komplo ile yapılabilir. Bunu yapmanın bir yolu R
(yukarıdaki kodun zaten girildiğini varsayarsak)
plot(g,scheme=2)
Yanıt değişkeniniz ayrıksa (örneğin ikili), bu çerçeveye lojistik bir GAM (in R
, family=binomial
çağrınıza ekleyeceğiniz gam
) yerleştirerek yerleştirebilirsiniz. Ayrıca, birden fazla öngörücünüz varsa, birden çok ek terim (veya normal doğrusal terimler) içerebilir veya çok değişkenli işlevler ekleyebilirsiniz; örneğin yordayıcınız varsa . Varsayılan yöntemleri kullanıyorsanız, burada çok fazla esneklik olmasına rağmen ilişkinin karmaşıklığı otomatik olarak çapraz doğrulama ile seçilir - ilgileniyorsanız yardım dosyasına bakın .x, z
gam
Doğrusal olmayan ilişki monotonik bir sıralama olsaydı (Spearman's rho) uygun olurdu. Örneğinizde, eğrinin monotonal olarak artıştan montonik olarak azalmaya doğru değiştiği, ilk türevinin eşit olduğu noktada olduğu gibi bir parabolün yaptığı gibi net bir küçük bölge var .
(En söz bazı modelleme bu değişikliğin noktası oluşur (ampirik bilgi ötesinde) bilgi varsa bence o zaman pozitif olarak korelasyon karakterize ve setinde Spearman rho kullanabilirsiniz) çiftleri nerede bu korelasyonun bir tahminini sağlamak ve için Spearman'ın korelasyonunun bir başka tahminini kullanmak için> , korelasyonun negatif olduğu yerde. Bu iki tahmin daha sonra ve arasındaki korelasyon yapısını karakterize eder ve tüm verileri kullanarak tahmin edildiğinde yakın olacak bir korelasyon tahmininin aksine , bu tahminler hem büyük hem de işaret bakımından zıt olacaktır.( x , y ) x < bir x > , bir X -Y 0
Bazıları sadece ampirik bilgilerin ( yani gözlenen çiftlerin bunu haklı çıkarmak için yeterli olduğunu iddia edebilir .
Her türlü bağımlılığı, mesafe korelasyon testleri kullanarak test edebilirsiniz. Uzaklık korelasyonu hakkında daha fazla bilgi için buraya bakınız: Uzaklık korelasyonu hesaplamalarını anlama
Ve işte orijinal makale: https://arxiv.org/pdf/0803.4101.pdf
R'de bu, fonksiyonla energy
birlikte pakette uygulanır dcor.test
.
Anlayışım burada yanlışsa biri beni düzeltir ancak doğrusal olmayan değişkenlerle baş etmenin bir yolu doğrusal bir yaklaşım kullanmaktır. Bu nedenle, örneğin, üstel dağılımın günlüğünü almak, değişkeni normal dağılım olarak değerlendirmenize izin vermelidir. Daha sonra herhangi bir doğrusal regresyon gibi problemi çözmek için kullanılabilir.
İki değişken arasındaki doğrusal olmayan ilişkiyi tespit etmek için genel katkı modelini kullandım, ancak son zamanlarda nlcor
R'deki paket aracılığıyla uygulanan doğrusal olmayan ilişkiyi öğrendim , bu yöntemi Pearson korelasyonu ile aynı şekilde uygulayabilirsiniz. korelasyon katsayısı, Pearson korelasyonunda olduğu gibi 0 ile 1 arasındadır ve -1 ile 1 arasında değildir. Daha yüksek bir korelasyon katsayısı, doğrusal olmayan güçlü bir ilişkinin varlığına işaret eder. Diyelim iki zaman serisi üstlenecek x2
ve y2
aşağıdaki gibi iki zaman serisi arasındaki doğrusal olmayan ilişki test edilir
install.packages("devtools")
library(devtools)
install_github("ProcessMiner/nlcor")
library(nlcor)
c <- nlcor(x2, y2, plt = T)
c$cor.estimate
[1] 0.897205
İki değişkenin doğrusal olmayan ilişki ile güçlü bir şekilde ilişkili olduğu görülüyor, ayrıca korelasyon katsayısı için ayarlanmış p-değerini de elde edebilirsiniz.
c$adjusted.p.value
[1] 0
Sonuçları da çizebilirsiniz
print(c$cor.plot)
Daha fazla detay için bu linki görüntüleyebilirsiniz.