Verilerin ortalaması alındıktan sonra verilerin sığdırılması ve sığdırılması ile ortalaması alınması arasındaki fark


10

Eğer varsa, bir çizginin birden fazla ayrı "deney" e uydurulması, daha sonra uygunlukların ortalaması veya ayrı deneylerden verilerin ortalaması alındıktan sonra ortalama verilerin uydurulması arasında. Açıklayayım:

Aşağıda gösterilen bir eğri oluşturan bilgisayar simülasyonları yapıyorum. Bir miktar çıkarırız, grafiğin doğrusal bölgesini (uzun zamanlar) takarak buna "A" diyelim. Değer basitçe doğrusal bölgenin eğimidir. Elbette bu doğrusal regresyon ile ilişkili bir hata var.

Ortalama "A" değerini hesaplamak için tipik olarak bu simülasyonlardan 100 kadarını farklı başlangıç ​​koşullarıyla çalıştırıyoruz. Ham verileri (aşağıdaki çizimden) ortalama 10'lu gruplara ortalamanın daha iyi olduğu, daha sonra "A" için uygun olduğu ve bu 10 "A" nın birlikte ortalama olduğu daha iyi söylendi.

Bunun herhangi bir değeri olup olmadığı ya da 100 ayrı "A" değerine uymaktan ve bunların ortalamasından daha iyi olup olmadığı konusunda sezgim yok.

veri


Anladığımdan emin değilim: A'yı farklı noktalarda ölçüyorsunuz ve sonra ? Sonra bunu birkaç kez yaparsınız ve tüm β 1'in ortalamasını alırsınız ? bir=β0+β1tβ1

Üzgünüm hayır. Yukarıdaki grafik tek bir simülasyonun sonucudur (buna deney diyelim). İlk doğrusal olmayan bölge atılır, daha sonra doğrusal kısma bir çizgi yerleştirilir ve "A" eğimi elde edilir. Yani bir simülasyonun tamamı tek bir "A" tahmini verir. Tabii ki sorum birçok parselin ortalamasının ardından A'nın hesaplanmasının, bir avuç parsel için A'nın hesaplanmasından ve bunların ortalamasından farklı olup olmadığı etrafında dönüyor. Umarım bu açıklığa kavuşur.
pragmatist1

1
Bunun neden bir fark yaratacağını anlamıyorum? (doğrusal regresyon için varsayımlar yerine getirilirse)

Her zaman küçük deneyler nedeniyle uydurma asla yanlış gitmez / yakınsama / gülünç dik tahmin vermek sanırım? Bu, ilk (veya hiyerarşik modelleri) birleştirmenin yardımcı olabileceği bir şey olurdu.
Björn

1
Tüm verileri bir araya getirebilirsiniz, ancak deneyleri (her deney için farklı kesişimler veya hatta farklı eğimler) ayırt etmek için bir çeşit bileşen ekleyin, bu da doğrusal karışık model yaklaşımı gibi. Bu şekilde, genel bir eğime yaklaşabilirsiniz, ancak deneyler arasındaki herhangi bir "parti" etkisini veya farklılığı tanımlayabileceksiniz
bdeonovic

Yanıtlar:


2

Biz zaman karşısında bir değişiklik söz konusu panel veri bağlamında konum düşünün ve firmalar arasında i . Her zaman periyodunu t ayrı bir deney olarak düşünün . Sorunuzu kullanarak bir etki tahmin etmenin eşdeğer olup olmadığını anlıyorum:tbent

  • Zaman serisi ortalamalarında kesitsel değişim.
  • Kesitsel varyasyonun zaman serisi ortalamaları.

Cevap genel olarak hayır.

Kurulum:

Formülasyonumda, her zaman periyodunu ayrı bir deney olarak düşünebiliriz .t

Tn(Xt,yt)

Y=[y1y2...yn]X=[X1X2...Xn]

Uyum ortalaması:

1TΣtbt=1TΣt(Xt'Xt)-1Xt'yt=1TΣtSt-1(1nΣbenxt,benyt,ben)nerede St=1nΣbenxt,benxt,ben'

Ortalamaların uygunluğu:

Bu, genel olarak zaman serisi ortalamalarının (yani, tahmin edici arasındaki) kesitsel varyasyonuna dayanan tahmine eşit değildir.

(1nΣbenx¯benx¯ben')-11nΣbenx¯beny¯ben

x¯ben=1TΣtxt,ben

Havuzda OLS tahmini:

b^=(X'X)-1X'Y=(1nTΣtXt'Xt)-1(1nTΣtXt'yben)
bt=(Xt'Xt)-1Xt'yben
=(1nTΣtXt'Xt)-1(1nTΣtXt'Xtbt)

S=1nTΣbenX'XSt=1nXt'XtE[xx']t

b^=1TΣt(S-1St)bt

bt

Özel durum: sağ taraftaki değişkenler zamanla değişmez ve firmaya özgüdür

benXt1=Xt2t1t2S=Stt

b^=1TΣtbt

Eğlenceli yorum:

Fama ve Macbeth , beklenen getirilerin firmaların pazarla (veya diğer faktör yüklemeleri) nasıl değiştiğini tahmin ederken tutarlı standart hatalar elde etmek için bu kesitsel ortalama tahmin tekniğini uyguladıklarında söz konusudur .

Fama-Macbeth prosedürü, hata terimleri kesitsel olarak ilişkili ancak zaman içinde bağımsız olduğunda panel bağlamında tutarlı standart hatalar elde etmenin sezgisel bir yoludur. Benzer sonuçlar veren daha modern bir teknik, zamanında kümelenmektir.


1

(Not: Yorum yapmak için yeterli itibarım yok, bu yüzden bunu bir cevap olarak gönderiyorum.)

y¯[x]=y[x]yxy1[x1]=y2[x1]=2y1[x2]=1y1[x2]=3y¯[x1]=y¯[x2]=2x1x2

Çoğu bilimsel yazılım platformunun gerçek "çevrimiçi" en küçük kareleri ( yinelemeli en küçük kareler olarak bilinir ) hesaplamak / güncellemek için araçlara sahip olması gerektiğini unutmayın . Böylece tüm veriler kullanılabilir (eğer istenirse).


1
Fcop tarafından gönderilen cevap silindi. Cevabınızı biraz değiştirmek isteyebilirsiniz
Glen_b -Restate Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.