Tüm nüfus üzerindeki gerileme


10

Tüm popülasyon dahil edildiğinde, bir regresyondaki katsayıdaki standart hatanın anlamı nedir?

Bu soru beni çok şaşırttı. Bana öyle geldiği için, standart hatalar tüm popülasyon dahil edildiğinde hiçbir anlam ifade etmiyor - zaten tüm popülasyona sahip olduğunuz için istatistiksel çıkarımlara gerek yok.

Ancak, en iyi dergilerde yayınlanan birçok makale tarafından bile çok yaygın olarak kullanılmaktadır. Örneğin, bir ülkenin GSYİH büyüme oranı ile nüfus yoğunluğu arasındaki ilişkiyi inceliyorsam, regresyonu yönetiyorum:

GDPi=α+βPopi+γXi+ϵi

yeryüzünde 195 ülke var. Durumda, tüm ülkeler (nüfus) dahil edilmiştir. Ancak tüm literatür hala katsayıların istatistiksel önemi hakkında konuşmaktadır.

Birisi, tüm popülasyonda gerileme yaparken istatistiksel çıkarımın yanlış kullanımı olduğunu açıklayabilir mi?


Bu soru istatistik ağında cevaplandı. Buraya bakın . Temel olarak, istatistiklerin hiçbir ilgisi yoktur. "Regresyon" tamamen matematiksel bir cihazdır.
luchonacho

@luchonacho Benim düşüncem, bu sorunun doğal olarak istatistiklerle örtüştüğümüz içerikle ilgili burada olduğu yönündedir. Yine de bunun esasen bir kopya olduğunu kabul ediyorum. Siteler arası kopyalarla ne yapacağım hakkında bir tartışma burada buldum
jmbejara

@jmbejara Referans için teşekkürler. Bunu bildiğim iyi oldu.
luchonacho

Bu, başka bir ilgili referansa benziyor. Athey Imbens (2017) 'de tartışıldığı gibi randomizasyon çıkarım denilen ilgili bir tekniği tartışmaktadır. jasonbaber.com/nonparibus/2017/09/25/…
jmbejara

Yanıtlar:


4

Başlangıçta bu soruyu, SE sitesi Cross Validated istatistiklerine geçmenin daha iyi olup olmayacağını araştırmak için moderatörler için işaretledim. Ancak OP çok spesifik bir ekonometri örneği sunduğundan, "nüfus / örnek" kavramının (çok derin) kavramının bu örnek için yararlı bir şekilde tartışılabileceğine inanıyorum.

İlk sorun , @AdamBailey cevabında tartışılıyor: eğer belirli bir yıl veya yıl için "dünyadaki tüm ülkeleri" dikkate alır ve verileri "nüfus" olarak etiketlerse, gelecek yıl farklı bir nüfusa ait olmalıdır. Farklı bir nüfusa aitse, bir popülasyondan sonuçları başka bir popülasyon için çıkarım yapmak için nasıl kullanacağız? Gerçekten de, burada "nüfusumuz" iki boyutlu , ülke ve zaman periyodudur - ve bu anlamda, zaman ufkunun açık uçlu olmasıyla, sadece elimizde bir örnek var.

İkinci konu (kısmen @luchonacho cevabında ima ediliyor) şu: nüfusumuz rastgele değişkenlerin gerçekte gözlemlenen gerçekleşmeleri değil "GDPi,i=1,..n. Veriler budur. Nüfusumuz, değer değil, işlev olan rastgele değişkenlerin kendisidir.

Dolayısıyla verilerimiz bu rastgele değişkenlerin olası birleşik gerçekleşmelerinden sadece biridir. Bu gerçekleşmeler sadece deterministik / mühendislik ilişkileri / nedenselliğin (katsayılara yansıyan) bir sonucu olarak değil, aynı zamanda doğası gereği rastgele faktörlerin etkisi altında meydana geldi. Bu anlamda, veriler "nüfus" un "saf / tipik" bir görüntüsü değildir-gürültü, yapısal olmayan bozukluklar, bir kerelik şoklar vb.

Daha sonra bu belirsizlik tahmin etmeye çalıştığımız katsayıların tahminine taşınacaktır, çünkü bu katsayıların bağımlı değişkenin nihai değerini etkileyen rastgele unsurlardan önce nedensellik veya birlikte hareketi tarif ettiğini varsayıyoruz.

Yukarıdaki her iki durumdan dolayı, "tahminlerin standart hatası" hakkında konuşmak bu durumda da tamamen geçerlidir ve daha sonra her zamanki gibi istatistiksel testleri uygular.


5

Hangi çıkarımın yapıldığı popülasyonun tam olarak ne olduğunu düşünmek önemlidir. Bu bağlamda zaman yönünü gözden kaçırmak kolaydır.

Örneğin, hedefin dünyadaki her ülke için önümüzdeki iki yıllık GSYİH'yi tahmin etmek olduğunu varsayalım. Sonra ilgilenilen nüfus "ülke, yıl" biçiminde bir çift kümesidir. Bu sadece "tüm ülkeler" değildir ve bir tahmin modeli her ülke için mevcut ve geçmiş yıllardaki verilerdeki gerileme ile tahmin edilmiş olsa bile, bu, tüm ilgili nüfusun dahil edildiği anlamına gelmez.

İlgilenilen tüm popülasyon için gerçekten eksiksiz bir veri kümesinden başlıyorsa, o zaman tek yapmanız gereken özet istatistikleri hesaplamaktır. Bu standart sapmaları içerebilir, ancak bu terim örnekleme dağılımı ile ilgili olduğu için bu standart hatalar olarak adlandırılması uygun değildir, ancak bu durumda tek "örnek" tüm popülasyondur.


Çok teşekkür ederim. Daha açık bir şekilde ifade etmek gerekirse, soruyu güncelledim, bu durumda 'tüm ülkeler' tüm nüfus olarak kabul ediliyor mu? Değilse, bu, bazı 'süper nüfustan' 'örnek' oldukları anlamına gelir - 'paralel evrende' milyonlarca ülke olduğunu ve dünyadaki 195 ülkenin kendi aralarında bağımsız ve özdeş olduğunu varsayalım ve rastgele örneklenir. Çok zor bir varsayım değil mi?
Akira Osawa
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.