Regresyon için hesaplanan verileri kullanabilir miyim


3

Regresyon analizi için hesaplanmış verileri kullanabilir miyim.

durum 1: ilk önce OLS $ y = \ alpha + \ beta x $ 'ı çalıştırın ve $ \ hat \ beta $' ı alın, sonra $ z = h ^ \ hat \ beta $ 'ı hesaplayın, en son $ $ $.

durum 2: durum 1 ile aynı ayarları uygulayın, $ z = \ zeta + \ rho p $ komutunu çalıştırın.

durum 3: matlab çözme denklemini $ k_i = \ sum_j d_ {ij} k_j $ $ k_i $ için kullanın, sonra $ w = \ theta + \ pi k $ komutunu çalıştırın.

$ \ alpha $, $ \ beta $, $ \ gamma $, $ \ mu $, $ \ zeta $, $ \ rho $, $ \ theta $ ve $ \ pi $ katsayıdır, diğer harfler değişkenleri belirtir .Y değişkenleri var y, x, h, m, p, $ d_ {ij} $, w. Değişkenler arasındaki tüm ilişkiler modellerdendir.

Onlar benim karşılaştığım bağımsız davalar.

$ \ Mu $, $ \ rho $ ve $ \ pi $ katsayılarını tahmin edeceğim.


1
Evet yapabilirsiniz, ancak birinin size bu parametreleri nasıl tahmin edeceğini göstermesini ister misiniz?
london

@london Hayır. Verileri regresyona hazırlamak için kullandığım yöntemi bilmek istiyorum. Hesaplanan veriler yerine bu gözlemlenebilir verileri kullanması gerektiğini düşündüm.
XJ.C

2
Bu durumda sorunun arka planını açıklamalısınız.
london

@london Onlar karşılaştığım bağımsız problemler.
XJ.C

1
O zaman, anlattıklarınla ​​devam etmen iyi.
london

Yanıtlar:


1

Korkarım kabul edilen cevap yeterince kesin değil ve çok yanıltıcı olabilir.

Bu konu resmen Oluşturulan Regresyon problemi Bu, regresyonda "üretilen" regresörleri kullandığımız zaman ortaya çıkar. Bu, yapısal denklemdeki seçim denkleminden tahmin edilen Ters Değirmen Oranını kullandığımız Heckman Seçim Modeli gibi tahminlerin çok yaygın bir özelliğidir. Konuyu ikiye bölmemiz gerekiyor:

  • Tutarlılık : bir regresyonda oluşturulan regresörleri kullanırken genellikle tutarlılık problemi yoktur. Resmi bir ispat Wooldridge'de (2010), sayfa 123'te bulunabilir.

  • İstatiksel sonuç : burada problemler olabilir. Boş altında oluşturulan regresörler sıfırdır, daha sonra standart hatalar ve tüm testler geçerlidir (yine de standart standart hataları kullanarak, her zamanki gibi heterosistemiklik ve seri korelasyonu düzeltmeniz gerekebilir). Bununla birlikte, eğer üretilen regresif istatistiksel olarak anlamlı ise, o zaman standart hatalar ve sonuç olarak herhangi bir test geçersiz . İhtiyacınız olan şey, asimptotik varyansın doğru bir tahmini. Formüller her bir duruma bağlıdır (Newey ve McFadden [1994] de daha fazla bilgi). Ancak, tutarlı standart hataları hesaplamak için genel bir çözüm kullanmaktır. önyükleme . Bir kenara, örneğin Stata kullanıyorsanız, normal komutunuzu önce aşağıdaki kodla çalıştırın:

    bootstrap, reps(400) seed(10101): regres ...
    

reps tekrar sayısı ve seed tekrarlanabilirlik içindir.

TL; DR

Eğer üretilen regresörünüz istatistiksel olarak anlamlı regresyonunuzda, standart önyükleme Çünkü onlar geçersiz . Eğer önemsizlerse, güvendesiniz.


İki soru: 1. Wooldridge (2010) nedir? 2. “Gerçek” olanların yerine üretilen regülatörlerin kullanılması nedeniyle “ölçüm hatası” nı hesaba katarak, regresör üretimini de engellememelisiniz? Son modelin hatalarının basitçe nasıl ön plana çıkarılmasının üretilen regresör sorununu çözeceğini anlamıyorum.
Richard Hardy

1

Birinin cevabı

Durum 1: beta_hat'ta bir tahmin hatası var. Bu yüzden Z, exp (beta_0) olarak tanımlanan gerçek Z'den farklı olan gerçekten Z_hat olarak adlandırılmalıdır. Kestirim hatası ikinci regresyonda değişken içinde hata sorununa dönüşür. Mu'nin OLS tahmincisi, sonlu numunelerdeki zayıflama eğiliminden muzdarip olacaktır. Bununla birlikte, büyük örneklerde beta_hattaki tahmin hatasının sapması sıfıra gittiğinde, zayıflama yanlılığı ortadan kalkar. Böylece regresyonu her zamanki gibi yapabilirsiniz.

2. Durum: Sorun değil. Sadece regresyonu her zamanki gibi yapın.

Durum 3: K'ları kesin olarak tahmin edebildiğiniz sürece sorun yok. Yani, sayısal hataların çok küçük olması gerekir. Aksi takdirde, 1. Durumdaki ile aynı problemi yaşarsınız.


1

luchonacho'nun cevabı akılda tutulması iyidir ama teklif ettiğin şeyi yapamayacağın anlamına gelmez, sadece bunu yapmak için iyi bir nedene sahip olman gerektiği anlamına gelir.

Tahmini değişkeninizi yalnızca durum 1 ve durum 2'de kullandığınız için bunlara odaklanacağım.

Hem durum 1 hem de durum 2'de regresör olarak X ve bağımlı değişken olarak y ile basit bir doğrusal regresyon tahmin ediyorsunuz. Bu, X ve Y'nin kesinlikle doğrusal bir anlamda ilişkili olduğuna inandığınız anlamına gelir. Yani beta şapkan sana X ve Y arasındaki çizginin eğimini söylüyor.

Daha sonra h'yi bir beta şapka gücüne yükseltirsiniz. H'nin başka bir değişken olduğunu varsayıyorum. Temel olarak bu sadece h'nin bir dönüşümüdür. H'de depolanan her bir değeri beta şapka gücüne yükseltiyorsunuz.

Eğer yapmak istediğin buysa, bunu yapmanın geçerli bir yolu gibi görünüyor ama değişkenlerinin nasıl ilişkili olduğunu bilmeden z'nin ne anlama geldiğini yorumlamakta zorlanıyorum.

Ayrıca, ilk önce dönüşümü neden yapmanız gerektiğini görmek için de mücadele ediyorum. Değişkenlerin nasıl ilişkilendirildiğiyle ilgili birkaç ayrıntıyla, ya da belki de çalışmanızdan bahsettiğiniz literatürün bir bağlantısı ile daha fazla yardımcı olabilirim.

Şu anda olduğu gibi, z değişkenini kullanarak yaptığınız gerilemelerin ekonomik olarak anlamsız olduğunu ve önemli istatistiksel sorunların olduğunu söyleyebilirim. Geri adım atmanızı ve özelliklerinizi tekrar düşünmenizi şiddetle tavsiye ederim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.