Açıklayıcı modellemede yanlılığı en aza indirmek, neden? (Galit Shmueli'nin “Açıklamak ya da Tahmin Etmek”)


15

Bu soru Galit Shmueli'nin "Açıklamak ya da Tahmin Etmek " başlıklı makalesine atıfta bulunmaktadır .

Profesör Shmueli özellikle bölüm 1.5, "Açıklama ve Tahmin Farklıdır" bölümünde şöyle yazar:

Açıklayıcı modellemede odak, temel teorinin en doğru temsilini elde etmek için önyargıların en aza indirilmesidir.

Gazeteyi her okuduğumda bu beni şaşırttı. Tahminlerdeki yanlılığı en aza indirmek temel teorinin en doğru temsilini verir?

Profesör Shmueli'nin burada yaptığı konuşmayı da izledim , JMP Discovery Summit 2017'de verdi ve şöyle diyor:

... büzülme modelleri, topluluklar gibi şeyler, bunları asla görmeyeceksiniz. Çünkü bu modeller, tasarım gereği, genel sapmayı / varyansı azaltmak için yanlılık getirir. Bu yüzden orada olmayacaklar, bunu yapmak için hiçbir teorik mantıklı değil. Modelinizi neden bilerek önyargılı kıldınız?

Bu gerçekten soruma ışık tutmuyor, basitçe anlamadığım iddiayı yeniden ifade ediyor.

Teorinin birçok parametresi varsa ve bunları tahmin etmek için yetersiz verilerimiz varsa, tahmin hatasına varyans hakim olacaktır. Bu durumda ridge regresyonu (daha düşük sapmalı önyargılı tahminlerle sonuçlanan) gibi önyargılı bir tahmin prosedürü kullanmak neden uygun olmaz?



@Adrian Bu harika bir soru, iyi sordu. Ben de buna tam bir cevap görmek isterim!
Matthew Drury

Yanıtlar:


6

Bu gerçekten büyük bir sorudur, ekonometrik ve sosyal bilim araştırmalarında istatistiksel modellerin kullanımı dünyasına bir tur yapılmasını gerektiren harika bir sorudur (gördüğümden, tanımlayıcı veya tahmine dayalı iş yapan uygulamalı istatistikçiler ve veri madencileri genellikle ilgilenmiyor bu formun önyargısı). Makalede kullandığım "önyargı" terimi, ekonometrisyenlerin ve sosyal bilimcilerin deneysel çalışmalardan nedenselliği çıkarmak için ciddi bir tehlike olarak gördükleri şeydir. İstatistiksel modeliniz ve altında yatan nedensel teorik model arasındaki farkı ifade eder . İlgili bir terim, hedefiniz nedensel bir açıklama olduğunda “regresyon modelinizi doğru bir şekilde belirtmeniz” (teoriye göre) öneminden dolayı ekonometride yoğun olarak öğretilen bir konu olan "model spesifikasyonu" dur. Görmekkısa bir açıklama için Şartname hakkındaki Wikipedia makalesi . Önemli bir SEVİL konudur altı şartname sen (teoriye göre) orada olmalıydım regresyon açıklayıcı değişken ihmal nerede denilen (OVB) "Değişken Önyargı atlanmış", - bu değişken olduğunu bağımlı değişken ile yakın ilişkili ve açıklayıcı değişkenlerden en az biri ile. Bu tür önyargının etkilerini açıklayan bu düzgün açıklamaya bakın ). Teorik bir bakış açısından, OVB, nedensellik modelden çıkarım yeteneğinize zarar verir.

Makalemin ekinde Açıklamak ya da Tahmin Etmek? yetersiz ("yanlış") bir modelin bazen daha yüksek tahmin gücüne sahip olabileceğini gösteren bir örnek vardır. Ama şimdi umarım bunun neden "iyi bir nedensel açıklayıcı model" hedefi ile çeliştiğini görebilirsiniz.


2
Tahminci ve açıklayıcı modeller hakkında hala çok karışıklık var. Büyük bir sigorta şirketinde veri bilimcisi ile röportaj yaptım ve ekibinde öngörücü veya açıklayıcı modeller oluşturup oluşturmadıklarını sordum. "Gerçekten önemli değil" dedi - farkı bildiğini sanmıyorum.
RobertF
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.