İktisat araştırmacıları neden ikili tepki değişkenleri için doğrusal regresyon kullanıyor?


13

Son zamanlarda, ekonomide birkaç makale okumak zorunda kaldım (çok aşina olmadığım bir alan). Fark ettiğim bir şey, tepki değişkeni ikili olsa bile, OLS kullanılarak takılan doğrusal regresyon modellerinin her yerde bulunabilmesidir. Benim sorum bu nedenle:

İktisadi alanda doğrusal regresyon neden örneğin lojistik regresyona tercih edilir? Bu sadece yaygın bir uygulama mı yoksa aktif olarak savunulan bir prosedür mü (gazetelerde, öğretmenler vb.)?

İkili yanıtla doğrusal regresyon kullanmanın neden kötü bir fikir olabileceğini veya alternatif yöntemlerin ne olduğunu sormadığımı lütfen unutmayın. Aksine, insanların bu ortamda neden doğrusal regresyon kullandıklarını soruyorum çünkü bu iki sorunun cevabını biliyorum.


5
Herhangi bir örnek verebilir misiniz?
Stephan Kolassa

7
Bu doğru değil. Ekonomi ve ekonometri de logit ve probit ve ilgili modeller hakkında geniş bir literatüre sahiptir. Ben de bir yabancıyım ve göreceli kullanımı kolayca ölçemiyorum, ancak literatür "her yerde" çürütecek kadar büyük (yani, her yerde!). Burada, doğrusal olasılık modelinin neden kullanıldığına dair bir soru var ve açıklamanın bulunması derin veya zor olması gerektiğini düşünmüyorum: anlaşılması basit ve bazen yeterince işe yarıyor.
Nick Cox

3
Ekonomi sadece matematikle çok rahat bir ilişkiye sahiptir. Bu konuda fazla endişelenmezdim.
Sycorax, Reinstate Monica'ya

1
@Sycorax Benzer bir his var. Ve eğer kişi matematik konusunda özensiz ise, yine de "işe yarayan" bir şey inşa edebilir.
Haitao Du

1
@Sycorax Bu ne doğru ne de adil. Şüphesiz, "Bu konuda çok fazla endişelenmeyeceksin" sorusunun sorumluluğu yoktur. Alt alana bağlı olarak, Ekonomi matematik ve istatistik ile çok güçlü bir ilişkiye sahip olabilir. Sadece İktisatçılar genellikle nedensel çıkarımla ilgilenirken, aynı zamanda gözlemsel verilerle de uğraşmak zorunda kalmıştır (birçok sosyal bilimin yaptığı gibi). Bu, bazı ekonomik sezgiler getirmeden güçlü bir matematiksel titizlik oluşturmayı son derece zorlaştırır.
StAtS

Yanıtlar:


18

Bu blog yayını Dave Giles ekonometri üzerine çoğunlukla blog özetliyor dezavantajları Doğrusal Olasılık Modeli (LPM) ait.

Bununla birlikte , araştırmacıların onu kullanmayı tercih etmesinin nedenlerinin kısa bir listesini içerir :

  • Hesaplama açısından daha basit.
  • "Marjinal etkileri" yorumlamak daha kolaydır.
  • "Link fonksiyonunun" yanlış tanımlanması riskini önler.
  • Endojen kukla regresörleriniz varsa Logit veya Probit ile ilgili komplikasyonlar vardır.
  • LPM, Logit ve Probit modellerinden beklenen marjinal etkiler, özellikle büyük bir örneklem boyutunuz varsa, genellikle çok benzerdir.

LPM'nin logit veya probit ile karşılaştırıldığında yaygın olarak kullanılan tek şey olduğunu bilmiyorum, ancak yukarıdaki nedenlerden bazıları bana mantıklı.


2
+1, Doğrusal Olasılık Modeli terimi için teşekkürler, daha önce bilmiyordum.
Haitao Du

1
Bu konuda daha fazla ilgileniyorsanız, Angrist ve Pischke'nin "Çoğunlukla Zararsız Ekonometri" bölümünde harika bir bölüm var.
shf8888

2

Dosyalanmış diğer makalelerden okurken benzer sorularım vardı. Ve bununla ilgili çok sayıda soru sordum, örneğin Eğitim Verileri Madenciliği topluluğundaki gibi: Neden lojistik kayıp yerine olasılıklar üzerinde kare kayıp kullanıyorsunuz?

Burada birçok kişisel görüş sunacağım.


Birçok pratik kullanım durumunda kayıp fonksiyonunun çok önemli olmadığını hissediyorum. Bazı araştırmacılar, kare kaybı hakkında daha fazla bilgi sahibi olabilir ve sistemi inşa edebilir, hala çalışır ve gerçek dünya sorunlarını çözer. Araştırmacılar asla lojistik kaybı veya menteşe kaybını bilmeyebilir ve denemek isteyebilirler. Ayrıca, en uygun matematik modelini bulmakla ilgilenmeyebilirler, ancak daha önce kimsenin çözmeye çalışmadığı gerçek problemleri çözmek isterler.

Bu başka bir örnek: sorumun cevabını kontrol ederseniz, hepsi benzer. Yaklaşık 0-1 kaybına kadar sınıflandırmada farklı kayıp fonksiyonlarını seçmenin etkileri nelerdir?


Daha fazla düşünce: bir makine öğrenimi araştırması, hangi modeli seçeceğinize ve modeli nasıl optimize edeceğinize çok fazla zaman harcayabilir. Bunun nedeni, bir makine öğrenimi araştırmacısının daha fazla veri toplama / daha fazla önlem alma yeteneğine sahip olmaması olabilir. Ve bir makine öğrenen araştırmacının işi, belirli bir gerçek dünya problemini daha iyi çözmemek için daha iyi matematik elde etmektir.

Öte yandan, gerçek dünyada, eğer veri daha iyiyse, her şeyi yener. Bu nedenle, sinir ağını veya rastgele ormanı seçmek çok önemli olmayabilir. Tüm bu modeller, makine öğrenimini gerçek dünya sorunlarını çözmek için bir araç olarak kullanmak isteyen bir kişiye benzer. Matematik veya araç geliştirmekle ilgilenmeyen bir kişi, sistemi daha iyi hale getirmek için belirli alan bilgisini kullanmaya daha fazla zaman ayırabilir.

Yorumda belirttiğim gibi. Ve eğer kişi matematik konusunda özensiz ise, yine de işe yarayan bir şey inşa edebilir.


1
(+1) Bu bir sürü "alıntı" hxd, ne demek istiyorlar? "Çalışır", çalıştığını düşündükleri anlamına mı gelir, ama "sorta çalışır" anlamına gelmez mi, yoksa "demek?"
Matthew Drury

@MatthewDrury yorum için teşekkürler. Sanırım çok fazla kişisel duygularım vardı ve bunları nasıl yazacağımı bilmiyorum. Bence birçoğu resmi ya da çok öznel değil. bu yüzden çok fazla alıntı yaptım.
Haitao Du

Onları sadece kişisel görüşler olarak etiketlemenin daha açık olduğunu düşünüyorum. Öğrencilerle sınıfta yaptığım şey şu: "Bu kişisel görüşe sınırlayıcı ama SVM'ler berbat" (gerçek bir örnek değil mi ...)
Matthew Drury

@MatthewDrury bana yazı konusunda tavsiyede bulunduğunuz için teşekkürler, hayır cevapta tırnak yok!
Haitao Du
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.