Veriler doğrusal değilse doğrusal bir regresyon önemli olabilir mi?


11

Önemli bir sonuçla ortaya çıkan doğrusal bir regresyon gerçekleştirdim, ancak dağılım grafiğini doğrusallık açısından kontrol ettiğimde verilerin doğrusal olduğundan emin değildim.

Dağılım grafiğini incelemeden doğrusallığı test etmenin başka yolları var mı?

Doğrusal regresyon, doğrusal olmasa önemli olabilir mi?

[Dağılım grafiklerini içerecek şekilde düzenlendi]

resim açıklamasını buraya girin

resim açıklamasını buraya girin

resim açıklamasını buraya girin

resim açıklamasını buraya girin


3
Soruların ve çoklu cevapların birden fazla yorumu olabilir (ancak temel olarak cevap her durumda evettir ve sonuç kanıtlarınız olarak davanızda kesinlikle mümkündür). Dağılım grafiğini gösterebilir misiniz? O zaman diğerleri, verilerin doğrusal olmadığı ve ne anlamda önemli sonucun zaten ortaya çıktığı ile ne demek istediğinizi anlayabilir.
Sextus Empiricus

5
Klasik bir dizi basit örnek için stats.stackexchange.com/search?q=anscombe+quartet adresine bakın . At stats.stackexchange.com/a/152034/919 Ben takım için aklınıza gelebilecek hemen her durum örneklerini inşa edebilen bir algoritma yayınlanmıştır.
whuber

YXYXYXX
Alexis

'H0:β0=c'H0:βx=c'H0:F=c'H0:R,2=c

Yavaş yanıt için verdiğiniz yanıtlar ve özür dileriz, teknolojiden uzaktayım! Gönderiyi önemli olan regresyonlar için dağılım grafiklerini içerecek şekilde düzenledim. Nasıl ilerleyeceğinize dair herhangi bir tavsiye çok takdir edilecektir.
IntoTheBlue

Yanıtlar:


18

Monotonik doğrusal olmayan ilişkiler, doğrusal modeller olarak modelleme yaparken neredeyse her zaman önemli olacaktır. İlişki doğrusal değilse ve monotonik değilse, örneğe bağlıdır.

Monotonik ilişkilere örnek olarak logaritma verilebilir.y=lnxy=x3y=x2y=günahx

x[-1,1]y=günahxy~x

resim açıklamasını buraya girin

x[0,π]resim açıklamasını buraya girin


13
+1. Ancak lütfen doğru terimin "monotonik" olduğunu unutmayın. "Monoton", tekrar yoluyla sıkıcı ve sıkıcı anlamına gelir.
whuber

22
lnxgünahx

+1 Tekdüzeğin ne anlama geldiğini de tanımlamayı öneririm.
Mark White

Teşekkür ederim, yayını dağılım dağılımlarını içerecek şekilde güncelledim. Nasıl ilerleyeceğinize dair herhangi bir tavsiye çok takdir edilecektir.
IntoTheBlue

(x-x¯)2
Aksakal

3

Evet, Aksakal haklıdır ve eğer gerçek ilişki doğrusal değilse doğrusal bir regresyon önemli olabilir. Doğrusal bir regresyon verilerinize en uygun çizgiyi bulur ve eğimin 0'dan önemli ölçüde farklı olup olmadığını test eder.

Doğrusalsızlık için istatistiksel bir test bulmaya çalışmadan önce, önce modellemek istediğiniz şeyi düşünmenizi öneririm. İki değişkeniniz arasında doğrusal (doğrusal olmayan) bir ilişki mi bekliyorsunuz? Tam olarak neyi ortaya çıkarmaya çalışıyorsunuz? Örneğin araba hızı ve fren mesafesi arasında doğrusal olmayan bir ilişki olduğunu varsaymak mantıklıysa, bağımsız değişkeninizin kare terimlerini (veya diğer dönüşümleri) ekleyebilirsiniz.

Ayrıca, verilerinizin görsel olarak incelenmesi (dağılım grafiği) çok güçlü bir yöntemdir ve analizinizde önemli bir ilk adımdır.


YX

Ayrıca: CV'ye hoş geldiniz Pawel!
Alexis

2
@Alexis Haklısın. Ancak ikinci dereceden bir terim eklemek, bazı metinlerde doğrusal olmama durumunu kontrol etmenin hızlı ve kirli bir yolu olarak hala sık görülen bir öneri (kimsenin doğrusal olmayanları modellemenin tek veya hatta ilk yol olduğunu önermediğini anlamak), bu yüzden ben bu pasajdan pek endişe etmiyor.
whuber

+1 @whuber Ne yazık ki, birçok araştırmacı, öğrenci ve fakülte ile kuadratik bir terim eklemenin ötesinde, bir dağılım grafiğini "doğrusal olmama testi nasıl yapılır" olarak görmenin ilk kontrolü olarak ekledim, olumsuz bir sonuç "doğrusal yeterli" ". (İkinci dereceden terimler gerçekten yararlı olabilir ve bunları kendi araştırmalarımda kullandım. :) "Hızlı ve kirli" konusundaki bakış açım, kolay öğretilen şeylerin , araştırmacıların ezici çoğunluğu için titiz hale gelmesidir . .. Parametrik olmayan regresyonların doğrusal olarak "kolay" ve araştırmak için daha iyi bir araç olduğunu düşünüyorum.
Alexis

@Alexis Teşekkürler. Sanırım beni yanlış anladın. Doğrusal olmayanlığı test etmek için kare terimler eklemeyi önermiyordum, ancak kesinlikle kare terimler (veya diğer dönüşümler. Ekonomik veriler genellikle log dönüştürülür) için vakalar yapılabilir. Keşifsel ve açıklayıcı analiz arasında bir ayrım olması gerektiğini düşünüyorum. Kareli bir ilişki varsaymak için doğrulanmış gerekçeler varsa, bunun test edilmesi gerekir. Teklif ettiğiniz şey daha keşifsel bir yaklaşımdır.
Pawel

-2

Aksakal'ın söylediği her şeye katılıyorum. Ama ilk soruya gelince cevabın korelasyon olduğunu düşünüyorum. Korelasyon x ve y veri setleri arasında ne kadar doğrusal bir ilişki olduğunu ölçer.


2
y=lnx

@gung Evet biliyorum. Hangi ifadesinin yanlış olduğunu düşünüyorsunuz? Doğrusal ve doğrusal olmayan kelimelerin ne anlama geldiğini anlamamı ve Aksakal'ın cevabında olduğu gibi, kesin ve doğrusal olmayan bir ilişkiye sahip değişkenlerin örneklerini bulmak gerçekten kolay. Bununla birlikte korelasyon doğrusal ilişkinin bir ölçüsüdür ve +/- 1 korelasyonu ilişkinin gerçekten doğrusal olduğu anlamına gelir. Bundan daha düşük herhangi bir korelasyon, ilişkinin (tam olarak değil) doğrusal olduğu, ancak yeterince yakın olabileceği anlamına gelir.
meh

1
OP "anlamlı bir sonuçla ortaya çıkan doğrusal bir regresyon gerçekleştirdi", ancak dağılım grafiği ilişkinin doğrusal olmadığını ima etti. Bir korelasyon da önemli olabilirdi, aslında, eğer regresyonun sadece 1 X-değişkeni olsaydı, regresyon ve korelasyondan gelen p-değerleri aynı olurdu. Fakat anlamlı gerilemeye rağmen ilişki doğrusal olmasaydı, anlamlı korelasyona rağmen yine de doğrusal olmayacaktır. Dolayısıyla, anlamlı bir korelasyon ilişkinin doğrusal olduğuna dair bir kanıt değildir.
gung - Monica'yı eski

1
r=1r=1r1

1
Bu aşırı ince veya hatta nitpick gibi gelebilir, ancak (a) korelasyonun iki değişkenli bir ilişkinin doğrusallığını ölçmenin bir yolu olduğunu kabul ediyorum - sonuçta bu matematiksel bir teorem - ama (b) genel bir öneri olarak, doğrusal olmama durumunu değerlendirmek için son derece kaba bir yol olarak yorumlanabilir . Doğrusal olmama kanıtı, yüksek mutlak örnek korelasyonu olan bir veri kümesinde çarpıcı olabilir ve küçük mutlak korelasyonu olan bir veri kümesinde tamamen mevcut olmayabilir. (cc @gung)
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.