İki sürekli değişkenin bağımsız olduğunu nasıl test ederim?


48

Bir örnek olduğunu varsayalım ortak dağıtım X ve Y . Bunu nasıl hipotezini test edebilirim X ve Y olan bağımsız ?(Xn,Yn),n=1..NXYXY

ve Y'nin ortak ya da marjinal dağıtım yasaları üzerinde bir varsayım yapılmaz (en azından ortak normallik, çünkü bu durumda bağımsızlık 0 ile korelasyonla aynıdır ).XY0

ve Y arasındaki olası bir ilişkinin doğası hakkında bir varsayımda bulunulmaz ; doğrusal olmayabilir, bu nedenle değişkenler birbiriyle ilişkili değildir ( r = 0 ), fakat yüksek oranda bağımlıdır ( I = H ).XYr=0I=H

İki yaklaşımı görebiliyorum:

  1. Her iki değişkeni de depolayın ve Fisher'in kesin testini veya G testini kullanın .

    • Pro: iyi bilinen istatistiksel testleri kullanın
    • Con: çekmeye bağlı
  2. Tahmin bağımlılık ve ve Y : I ( x , Y )XYI(X;Y)H(X,Y) (bu,birbirlerini tamamen belirlediklerindebağımsızXveYve1için).0XY1

    • Pro: net bir teorik anlamı olan bir sayı üretir
    • Con: yaklaşık entropi hesaplamasına bağlıdır (yani, tekrar binmek)

Bu yaklaşımlar mantıklı geliyor mu?

İnsanların başka hangi yöntemleri kullandığı?


3
İçine bak mesafe korelasyon .
Ray Koopman

@ RayKoopman: teşekkürler, şimdi Uzaklık Korelasyonu ile Bağımlılığı Ölçme ve Test Etme okuyorum !
sds

1
I(X;Y)/H(X;Y)HXY

@fonini: Elbette, binned değişkenlerden bahsediyordum. Yine de yorumunuz için teşekkürler.
sds

Yanıtlar:


27

Bu genel olarak çok zor bir sorundur, ancak değişkenleriniz görünüşte yalnızca 1d olmasına yardımcı olur. Elbette, ilk adım (mümkün olduğunda) verileri çizmek ve size bir şey çıkıp çıkmadığını görmek olmalıdır; 2d içindesiniz, bu yüzden bu kolay olmalı.

Rn


Bu yaklaşımların Mesafe Korelasyonu ile karşılaştırılmasından kısaca bahsedebilir misiniz ? Büyük veri kümelerini (benim için büyük) elemek için DC'yi kullanıyorum, bu nedenle olabilecek tüm yorumlarınızla ilgileniyorum. Teşekkürler!
pilot

1
Pteetor Bu ilginç, daha önce mesafe korelasyonu boyunca koşmamıştım. Hesaplamalı olarak, büyük örneklem büyüklükleri için entropi kestirimi yaklaşımından daha pahalı görünüyor çünkü tam mesafe matrislerine ihtiyacınız var (entropi tahmin edicileri için indeksleri yalnızca ilk kkomşuları almak için kullanabilirsiniz ). İstatistiki güç / vb. Açısından nasıl karşılaştırıldığı hakkında hiçbir fikrim yok
Dougal

4
Daha sonraki okuyucular için: 2013 makalesi Sejdinovic ve ark.nın hipotez testlerinde mesafeye dayalı ve RKHS bazlı istatistiklerin denkliği. mesafe korelasyonunun ve diğer enerji mesafelerinin, HSIC'in arkasındaki temel önlem olan MMD'nin özel örnekleri olduğunu gösterir ve ilişkinin test gücü ve benzerleri açısından tartışıldığını gösterir.
Dougal


6

Bu kağıttan ne haber:

http://arxiv.org/pdf/0803.4101.pdf

"Mesafelerin korelasyonuyla bağımlılığın ölçülmesi ve test edilmesi". Székely ve Bakirov'un her zaman ilginç şeyleri vardır.

Uygulama için matlab kodu var:

http://www.mathworks.com/matlabcentral/fileexchange/39905-distance-correlation

Bağımsızlık için başka herhangi bir (uygulaması basit) bir test bulursanız bize bildirin.


2
Siteye Hoşgeldiniz, @JLp. Sorular ve cevaplar şeklinde yüksek kalitede istatistiksel bilgilerin kalıcı bir şekilde depolanmasını umuyoruz. Bu nedenle endişelendiğimiz tek şey linkrot. Bunu göz önünde bulundurarak, bu makalede ne olduğuna / bağlantının kopması durumunda sorulara nasıl cevap verdiğine dair bir özet verir misiniz? Ayrıca, bu konunun gelecekteki okuyucularının gazeteyi okumak için zaman harcamak isteyip istemediklerine karar vermesine yardımcı olacaktır.
gung - Reinstate Monica

@gung: Bu aynıdır enerji
sds

5

Çalışmada Mesafe Kovaryansı ve çekirdek testleri (Hilbert-Schmidt bağımsızlık kriterine göre) arasındaki bağlantı verilmiştir:

Sejdinovic, D., Sriperumbudur, B., Gretton, A. ve Fukumizu, K., Hipotez Testlerinde Uzaklık ve RKHS-Bazlı İstatistiğin Eşitliği, İstatistik Annals, 41 (5), s.2263-2702, 2013

Uzaklık kovaryansının, belirli bir çekirdek ailesi için çekirdek istatistiğinin özel bir durumu olduğu gösterilmiştir.

Karşılıklı bilgileri kullanmak niyetindeyseniz, MI'nin ikili tahminini temel alan bir test:

Gretton, A. ve Gyorfi, L., Tutarlı Parametrik Olmayan Bağımsızlık Testleri, Makine Öğrenimi Araştırmaları Dergisi, 11, s.1391 - 1423, 2010.

En iyi test gücüne sahip olmak ilginizi çekiyorsa, bining ve karşılıklı bilgiler yerine, çekirdek testlerini kullanmaktan daha iyi olursunuz.

Dedi ki, değişkenleriniz tek değişkenlik gösterdiğinde, Hoeffding'inki gibi klasik parametrik olmayan bağımsızlık testleri muhtemelen iyidir.


4

İstatistiklerde nadiren (asla?), Örnek istatistik durumunuzun = bir puan değeri olduğunu gösterebilir misiniz? Puan değerlerine karşı test edebilir ve bunları hariç tutabilir ya da hariç tutabilirsiniz. Ancak istatistiklerin niteliği, değişken verilerin incelenmesiyle ilgilidir. Her zaman bir varyans olduğu için, o zaman mutlaka bir şeyin tam olarak ilişkili, normal, gauss vb. Olmadığını bilmenin bir yolu olmayacaktır. Bir değerin makul değerler aralığının dışında olup olmadığını öğrenebilirsiniz. Örneğin, hiçbir ilişkiyi dışlamak ve ilişkinin ne kadar büyük olduğuna dair çeşitli değerler vermek kolaydır.

Bu nedenle, hiçbir ilişki göstermemeye çalışmak, esasen asıl değeri relationship = 0başarı ile karşılamayacak. Yaklaşık 0 olarak kabul edilebilecek bir dizi ilişki ölçüsü varsa, o zaman bir test hazırlamak mümkündür.

Bu sınırlamayı kabul edebileceğinizi varsayarsak, düşük bir eğriye sahip bir saçılma grafiği sağlamanıza yardımcı olmaya çalışan kişilerin yararı olacağını düşünelim. Aradığınız R çözümleri deneyin çünkü:

scatter.smooth(x, y)

Şimdiye kadar verdiğiniz sınırlı bilgiye dayanarak, genelleştirilmiş bir katkı modelinin bağımsız olmama testi için en iyi şey olabileceğini düşünüyorum. Bunu CI'ler ile öngörülen değerler etrafında çiziyorsanız, bir bağımsızlık inancı hakkında açıklamalar yapabilirsiniz. Check out gammgcv paketinde. Yardım oldukça iyi ve burada CI ile ilgili yardım var .


2

İlginç olabilir ...

Garcia, JE; Gonzalez-Lopez, VA (2014) En uzun artan sıralamaya göre sürekli rastgele değişkenler için bağımsızlık testleri. Çok Değişkenli Analiz Dergisi, v. 127 s. 126-146.

http://www.sciencedirect.com/science/article/pii/S0047259X14000335


2
Bu gönderi, makalede ne olduğu hakkında, özellikle bir ödeme duvarının arkasında olduğu gibi, daha fazla ayrıntıdan yararlanabilir.
Erik,

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.