Uzak kovaryans ne zaman doğrusal kovaryanstan daha az uygundur?


21

Ben sadece (belli belirsiz) brownian / mesafe kovaryansı / korelasyonuna girdim . Bağımlılık testi yapılırken, doğrusal olmayan birçok durumda özellikle yararlı görünüyor. Ancak, kovaryans / korelasyon çoğu zaman doğrusal olmayan / kaotik olmayan veriler için kullanılmasına rağmen, çok sık kullanılmıyor gibi görünüyor.

Bu bana mesafe kovaryansının bazı sakıncaları olabileceğini düşünüyor. Öyleyse onlar neler ve neden herkes hep uzak kovaryansı kullanmıyor?



Doğrusal olmayan zaman serilerini karşılaştırmak ve bunları ağırlıkla birleştirmek için dcov kullandığınızı okudum ... Yaptığınız şeyin ağırlıklı bir mesafe kovaryansı kullanıp kullanmadığını merak ediyorum. mesafe korelasyonu Bunu yapmaya çalışıyorum, ancak mesafe korelasyon formüllerine bir ağırlık vektörü eklemenin doğru yol olup olmadığından emin değilim.
user3757561

Hayır, üzgünüm @ user3757561, sadece korelasyonun yerine bir mesafe korelasyonu deniyordum ve sonra buna göre ağırlıklar yaratıyordum. Ama yine de kullanmaktan vazgeçmedim ...
naught101

Yanıtlar:


18

Aşağıda listelenen referansları okuyarak izlenimlerime dayanarak mesafe kovaryansı hakkında birkaç yorum toplamaya çalıştım. Ancak kendimi bu konuda uzman olarak görmüyorum. Yorumlar, düzeltmeler, öneriler vb.

Sözler, orijinal soruda istendiği gibi potansiyel dezavantajlara karşı (şiddetle) önyargılı .

Gördüğüm gibi, potansiyel dezavantajları aşağıdaki gibidir:

  1. Metodoloji yeni . Tahminime göre, bu şu anda popülerlik eksikliği ile ilgili en büyük faktördür. Mesafe kovaryansını gösteren makaleler 2000'li yılların ortalarında başlar ve günümüze kadar devam eder. Yukarıda belirtilen yazı en çok dikkat çeken (yutturmaca?) Ve üç yaşından küçüktür. Buna karşılık, korelasyon ve korelasyon benzeri önlemler teorisi ve sonuçları zaten arkalarında bir asırdan fazla çalışmaktadır.
  2. Temel kavramlar daha zordur . Pearson'un ürün momenti korelasyonu operasyonel düzeyde, üniversite matematiğine bir matematik geçmişi olmadan kolayca hazırlanabilir. Basit bir "algoritmik" bakış açısı ortaya konulabilir ve geometrik sezginin tanımlanması kolaydır. Tersine, mesafe kovaryansı durumunda, çift öklid mesafelerindeki ürünlerin toplamları kavramı bile biraz daha zordur ve stokastik bir sürece ilişkin kovaryans nosyonu böyle bir izleyici kitlesine makul bir şekilde açıklanabilecek olanın ötesine geçmektedir. .
  3. Hesaplamalı olarak daha talepkar . Test istatistiklerini hesaplamak için temel algoritma , standart korelasyon ölçümleri için O ( n ) ' nin aksine, örneklem büyüklüğünde ' dir . Küçük örneklem büyüklükleri için bu önemli bir şey değil, daha büyük boyutlar için daha önemli hale gelir.O(n2)O(n)
  4. Test istatistiği, asimptotik olarak bile dağılımsız değildir . Bir kişi, tüm alternatiflere karşı tutarlı bir test istatistiği için, dağılımın - en azından asimptotik olarak - boş hipotez altında ve Y'nin temel dağılımlarından bağımsız olabileceğini ümit edebilir . Boş değer altındaki dağılım X ve Y'nin temel dağılımına bağlı olduğundan , örneklem büyüklüğü sonsuzluğa bağlı olduğu için mesafe kovaryansı için bu geçerli değildir . Olan dağılımları eşit bir ile sınırlı olduğu doğru χ 2 1 bir hesaplanmasına izin vermektedir dağıtım, tutucu kritik değerin.XYXYχ12
  5. |ρ|
  6. Bilinmeyen güç özellikleri . Tüm alternatiflere karşı tutarlı olmak, temel olarak mesafe kovaryansının bazı alternatiflere karşı çok düşük güce sahip olmasını garanti eder. Pek çok durumda, belirli ilgi alanlarına karşı ek güç kazanmak için genellikten vazgeçmeye isteklidir. Orijinal makaleler, standart korelasyon ölçütlerine göre yüksek güç talep ettikleri bazı örnekleri göstermektedir, ancak yukarıda (1.) 'e dönüp, alternatiflere karşı davranışının henüz iyi anlaşılmadığına inanıyorum.

Yinelemek için, bu cevap muhtemelen oldukça olumsuzdur. Ancak, amaç bu değil. Mesafe kovaryansı ile ilgili çok güzel ve ilginç fikirler var ve bunun göreceli yeniliği de daha iyi anlaşılması için araştırma yollarını açıyor.

Kaynaklar :

  1. GJ Szekely ve ML Rizzo (2009), Brownian mesafe kovaryansı , Ann. Baş. Devletçi. , vol. 3, hayır. 4, 1236-1265.
  2. GJ Szekely, ML Rizzo ve NK Bakirov (2007), Mesafelerin Korelasyonuyla Bağımsızlığın Ölçülmesi ve Test Edilmesi , Ann. Devletçi. , vol. 35, 2769-22794.
  3. R. Lyons (2012), Metrik uzaylarda uzaklık kovaryansı , Ann. Probab. (görünmek).

Mükemmel cevap, teşekkürler. Bazıları biraz kafamın üstünde ama sanırım kendimi
düzeltebileceğimi

1
Ayrıca bakınız: “Brownian Uzaklık Kovaryansı” İstatistik Özeti Kulübü, 36-825 Benjamin Cowley ve Giuseppe Vinci 27 Ekim 2014 stat.cmu.edu/~ryantibs/journalclub/dcov.pdf
Felipe G. Nievinski

2
O(ngünlükn)

3

Bir şeyleri özlüyor olabilirim, ama sadece iki değişken arasındaki doğrusal olmayan bağımlılığın bir miktarını ölçmek çok fazla bir kazanıma sahip görünmüyor. Size ilişkinin şeklini söylemeyecek. Bir değişkeni diğerinden tahmin etmeniz için hiçbir yol vermez. Benzer bir şekilde, keşifsel veri analizi yaparken, bazen verilerin en iyi düz çizgi, kuadratik, kübik vb. kendisi çok kullanışlı bir tahmin aracı değildir. İki değişkenli bir şekli tanımlamak için uygulanabilir bir denklem bulma yolundaki ilk yaklaşım. Bu denklem, boşluktan farklı olarak (veya uzaklık kovaryansı sonucundan farklı olarak), doğrulayıcı bir modelin temelini oluşturabilir.


Benim amaçlarıma göre, bir getirisi var. Herhangi bir şeyi tahmin etmek için dcov () kullanmıyorum, bunun yerine bir topluluktaki çoklu doğrusal olmayan zaman serilerini karşılaştırmak ve bağımlılıklarına dayanan ağırlıklar ile birleştirmek. Bu durumda, dcov () potansiyel olarak büyük faydalara sahiptir.
naught101

@ naught101 -Mombine 'dediğinizde bazı cevher bilgisini koyabilir misin? Bu, doğrusal olmayan bağımlılığa dayanan ağırlıklandırma açısından bana ilginç geliyor. Zaman serilerini gruplara ayırmayı mı kastediyorsunuz? Ayrıca, bu senaryoda yüksek ve düşük ağırlıklar nelere vurgu yapar?
doyurucu

2
@PraneethVepakomma: Cevaplarıma bir göz atın. İstatistik.stackexchange.com
questions/

1
Ayrıca, genel bağımlılık formunu (örneğin, polinom denklemi) biliyorsanız, o zaman belirleme katsayısını kullanarak bağımlılığın gücünü ölçebilirsiniz, bakınız, örneğin, Polinom Regresyonları için Ayarlanmış R2'nin
Hesaplanması
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.