Doğrusal regresyonda öngörülen değerler için güven aralığı şekli


69

Doğrusal bir regresyonda öngörülen değerler için güven aralığının, yordayıcının ortalaması çevresinde ve yordayıcının minimum ve maksimum değerleri etrafındaki yağları daralma eğiliminde olduğunu fark ettim. Bu, bu 4 doğrusal regresyonun parsellerinde görülebilir:

görüntü tanımını buraya girin

Başlangıçta bunun, tahmin edicilerin değerlerinin çoğunun tahmin edicinin ortalaması çevresinde toplandığından dolayı olduğunu düşündüm. Bununla birlikte, güven aralığının dar ortasının, tahmin edicinin aşırı uçları çevresinde yoğunlaşsa bile, tahmin edicinin çok sayıda değerinin minimum etrafında yoğunlaştığı sol alt doğrusal regresyonda olduğu gibi olacağını fark ettim. öngörücü.

Doğrusal bir regresyonda tahmin edilen değerler için güven aralıklarının neden ortada dar, uçlarda da yağlanma eğiliminin olduğunu açıklayabilir mi?

Yanıtlar:


86

Sezgisel terimlerle tartışacağım.

Hem regresyondaki güven aralıkları hem de tahmin aralıkları, kesişme ve eğimin belirsiz olduğu gerçeğini hesaba katar - verilerdeki değerleri tahmin edersiniz, ancak popülasyon değerleri farklı olabilir (yeni bir örnek aldıysanız, farklı bir tahminde bulunursunuz. değerleri).

(x¯,y¯)y=a+b(xx¯)a^=y¯

(x¯,y¯)

±

görüntü tanımını buraya girin

x¯,y¯

görüntü tanımını buraya girin

(x¯,y¯)x

görüntü tanımını buraya girin

±

x¯

Sezgi budur.


Şimdi, eğer istersen, biraz cebir düşünebiliriz (ama zorunlu değil):

Aslında bu iki etkinin karelerinin toplamının karekökü - güven aralığının formülünde bunu görebilirsiniz. Parçaları yapalım:

abσ/nayxx¯

baσ/i=1n(xix¯)2xxx¯(xx¯)σ/i=1n(xix¯)2

y=a+b(xx¯)ab

(σ/n)2+[(xx¯)σ/i=1n(xix¯)2]2

x

σ1n+(xx¯)2i=1n(xix¯)2

xx¯

[Tahmini aralıklarla, işlem değişkenliği nedeniyle pozisyonda da farklılıklar vardır; bu, limitleri yukarı ve aşağı kaydırıp, daha geniş bir yayılma sağlayarak başka bir terim ekler ve bu terim genellikle karekök altındaki toplamı domine ettiği için eğrilik çok daha az belirgindir.]


Çok sezgisel olan teşekkürler Glen_b. Güven aralığının hesaba kattığı şey aklımdan geçmedi.
luciano

1

Kabul edilen cevap gerçekten de gerekli sezgiyi getiriyor. Sadece, söz konusu parsellere çok hoş bir şekilde gönderme yapan hem doğrusal hem de açısal belirsizliklerin bir araya getirilmesinin görselleştirilmesini özlüyor. Yani işte gidiyor. Diyelim a've b'belirsizlikleri ave bsırasıyla, büyüklük, genellikle herhangi bir popüler istatistik paket tarafından döndü. Sonra, en uygun olanın dışında, a*x + bçizilmesi gereken dört olası çizgimiz var (bu, 1 değişkenlik x)

  • (a+a')*x + b+b'
  • (a-a')*x + b-b'
  • (a+a')*x + b-b'
  • (a-a')*x + b+b'

Bunlar aşağıdaki grafikte toplanan dört satırdır. Ortadaki siyah kalın çizgi belirsizlikler olmadan en iyi uyumu temsil ediyor. Öyleyse "hiperbolik" gölgelemeleri çizmek için, bu dört çizginin maksimum ve minimum değerlerini almalı, aslında dört çizgi kesiti var, orada eğri yok (merak ediyorum, bu çit çizgilerinin ne kadar eğri çizdiğini görünmüyor. Bana doğru herhangi bir).

Umarım bu, @Glen_b'den gelen güzel cevaplara bir şeyler ekler.

görüntü tanımını buraya girin

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.