Regresörlerde koşullandırma ile bunları sabit olarak tedavi etme arasındaki fark nedir?

Bazen regresörlerin sabit olduğunu, yani stokastik olmadığını varsayıyoruz. Ben düşünüyorum anlama geldiğini tüm belirleyicileri, parametre tahminleri vb sonra sağ koşulsuz vardır? O kadar ileri gidebilirim ki artık rastgele değişken değiller mi?

Öte yandan, iktisattaki çoğu gerilemecinin stokastik olduğunu söyleriz, çünkü dış güçler bunları bazı deneyleri akılda tutarak belirlemedi. Ekonometristler daha sonra bu stokastik regresörleri koşullandırırlar.

Bu onlara sabit muamele etmekten nasıl farklıdır?

Şartlanmanın ne olduğunu anlıyorum. Matematiksel olarak, biz tüm gözlem ve çıkarım koşullu hale gelir o bizim regresörün farklı gerçekleşmesini (örneğin isimli görmüştü aynı olurdu regresörlerin özellikle seti vb bu çıkarımlar, parametre tahminleri, varyans tahminleri söylemek gözümüz var her zaman serisinin sadece bir kez görüldüğü zaman serilerindeki temel nokta).

Bununla birlikte, sabit regresörler ile stokastik regresörlerin koşullandırılması arasındaki farkı gerçekten kavramak için, burada herhangi birinin sabit regresörler için geçerli olan ancak stokastik olduklarında bozulan (ve koşullandırılmalıdır).

Bu örnekleri görmek için sabırsızlanıyorum!

— Hírek
kaynak

Değişkenlerdeki hatalara aşina mısınız?

— robin.datadrivers

Hey @ robin.datadrivers hayır aslında değilim.

— Hirek

Bunlar, bağımsız değişkenlerdeki ölçüm hatası tahminlerini ayarlamak için özel olarak tasarlanmış modellerdir. Stokastik regresörler ile tam olarak aynı değildir, ancak bir göz atmanız yararlı olabilir. Ayrıca, anket araştırması genellikle anketler tarafından toplanan bağımsız değişkenlerin örnekleme hatasına sahip olduğunu varsayar - muhtemelen orada örnekleme hatasını açıklayan modeller vardır.

— robin.datadrivers

Karşılaştığım bir diğer düşünce Bayesci modelleri kullanmaktı. Bayes modelleri regresörleri kendileri için önceden bir dağılım belirleyerek rasgele tedavi edebilirler. Genellikle sabit olarak ele alınırlarsa, yalnızca parametreler için bir önceki dağılım belirtirsiniz (katsayılar, ortalamalar, varyanslar), ancak eksik değişkenler veya sonuçlar varsa, bunlar için bir önceki dağılım belirtirsiniz. Daha fazla düşünmeden nasıl uygulayacağımı tam olarak bilmiyorum, ama belki de her bağımsız değişken için önceki bir dağılımı belirtmenin bir yolu var.

— robin.datadrivers

Burada ince buz üzerindeyim ama deneyeyim: İstatistikler ve ekonometri arasındaki temel farkın, istatistiklerde regresörleri sabit olarak görme eğiliminde olduğumuz, dolayısıyla açık bir şekilde gelen terminoloji tasarım matrisi olduğumuzu hissediyorum (lütfen yorum yapın!) varsayım nerede olduğunu, deneylerin tasarımı biz ilk olan seçme ve daha sonra sabitleme açıklayıcı değişkenler.

Ancak çoğu veri seti, çoğu durum için bu kötü bir seçimdir. Açıklayıcı değişkenleri gerçekten gözlemliyoruz ve bu anlamda yanıt değişkenleri ile aynı temelde dururlar, her ikisi de kontrolümüz dışındaki rastgele bir süreç tarafından belirlenir. Dikkate alarak $x$ "sabit" olarak, neden olabilecek pek çok sorunu dikkate almamaya karar veriyoruz.

Regresörleri stokastik olarak değerlendirirken, ekonometristlerin yapma eğiliminde olduğu gibi, bu tür problemleri düşünmeye çalışan modelleme olasılığını açıyoruz. O zaman dikkate alabileceğimiz ve modele dahil edebileceğimiz sorunların kısa bir listesi:

regresörlerde ölçüm hataları
regresörler ve hata terimleri arasındaki korelasyonlar
regresör olarak gecikmiş cevap
...

Muhtemelen, bugün yapıldığından çok daha sık yapılmalıdır?

EDIT

Bir şekilde daha resmi olarak regresörlerin şartlandırılması için bir tartışma yapmaya çalışacağım. İzin Vermek $(Y,X)$ rastgele bir vektör ol ve ilgi regresyonda $Y$ üzerinde $X$ , regresyonun, $Y$ üzerinde $X$ . Çok doğrusal varsayımlar altında doğrusal bir işlev olacaktır, ancak argümanlarımız buna bağlı değildir. Eklem yoğunluğunu her zamanki gibi çarpanlarına ayırmakla başlıyoruz

f (y, x) = f (y ∣ x) f (x)

$f(y,x) = f(y\mid x) f(x)$ ancak bu işlevler bilinmiyor, bu nedenle parametreli bir model kullanıyoruz

f (y, x; θ, ψ) = f_{θ} (y ∣ x) f_{ψ} (x)

$f(y,x; \theta, \psi)=f_\theta(y \mid x) f_\psi(x)$ nerede

θ

$\theta$ koşullu dağılımı parametrelendirir ve

ψ

$\psi$ marjinal dağılımı

X

$X$ . Normal doğrusal modelde

θ = (β, σ^{2})

$\theta=(\beta, \sigma^2)$ fakat bu varsayılmaz. Tam parametre alanı

(θ, ψ)

$(\theta,\psi)$ dır-dir

Θ \times Ψ

$\Theta \times \Psi$ , bir Kartezyen ürün ve iki parametrenin ortak bir parçası yoktur.

Bu, öncelikle istatistiksel deneyin (veya veri oluşturma sürecinin, DGP'nin) çarpanlarına ayrılması olarak yorumlanabilir. $X$ göre üretilir $f_\psi(x)$ ve ikinci bir adım olarak, $Y$ koşullu yoğunluğa göre üretilir $f_\theta(y \mid X=x)$ . İlk adımın herhangi bir bilgi kullanmadığını unutmayın. $\theta$ , bu sadece ikinci aşamaya girer. İstatistik $X$ için yardımcı $\theta$ , bkz. https://en.wikipedia.org/wiki/Ancillary_statistic .

Ancak, ilk adımın sonuçlarına bağlı olarak, ikinci adım az çok bilgilendirici olabilir. $\theta$ . Tarafından verilen dağıtım $f_\psi(x)$ çok düşük varyansa sahip, diyelim ki $x$ küçük bir bölgede yoğunlaşacak, bu yüzden tahmin etmek daha zor olacak $\theta$ . Dolayısıyla, bu iki aşamalı deneyin ilk kısmı, $\theta$ tahmin edilebilir. Bu nedenle koşullandırmak doğaldır $X=x$ regresyon parametreleri hakkında çıkarımda bulunur. Koşulluluk argümanı budur ve yukarıdaki taslak varsayımlarını açıklığa kavuşturmaktadır.

Tasarlanan deneylerde varsayımı çoğunlukla gözlemsel verilerle değil, çoğunlukla geçerli olacaktır. Sorunlara örnek olarak şunlar verilebilir: yordayıcı olarak gecikmeli yanıtlarla regresyon. Bu durumda öngörücüler üzerinde koşullandırma da cevabı koşullandıracaktır! (Daha fazla örnek ekleyeceğim).

Bu sorunları çok ayrıntılı olarak tartışan bir kitap Bilgi ve üstel ailelerdir: O.E Barndorff-Nielsen'in istatistik teorisinde . Bkz. Özellikle 4. bölüm. Yazar , bu durumda ayırma mantığının nadiren açıklandığını, ancak aşağıdaki referansları verdiğini söylüyor : RA Fisher (1956) İstatistiksel Yöntemler ve Bilimsel Çıkarım $\S 4.3$ ve Sverdrup (1966) Karar teorisinin mevcut durumu ve Neyman-Pearson teorisi .

— kjetil b halvorsen
kaynak