Gerçekten “ilgili tüm tahmin edicileri” dahil etmemiz gerekiyor mu?


15

Çıkarım için regresyon modellerini kullanmanın temel bir varsayımı, "tüm ilgili öngörücülerin" tahmin denklemine dahil edilmesidir. Bunun mantığı, önemli bir gerçek dünya faktörünün dahil edilmemesinin taraflı katsayılara ve dolayısıyla yanlış çıkarımlara (yani, atlanan değişken sapmaya) yol açmasıdır.

Ancak araştırma pratiğinde, "tüm ilgili yordayıcılara" benzeyen herhangi bir şey içeren hiç kimseyi görmedim . Birçok fenomenin sayısız önemli nedeni vardır ve imkansız değilse de hepsini dahil etmek çok zor olacaktır. Manşet dışı bir örnek, depresyonu bir sonuç olarak modellemektir: Hiç kimse, "tüm ilgili değişkenleri" içeren bir modele yakın bir şey inşa etmedi : örneğin, ebeveyn tarihi, kişilik özellikleri, sosyal destek, gelir, etkileşimleri vb. vb...

Ayrıca, bu kadar karmaşık bir modelin takılması, çok büyük örnek boyutları olmadıkça, oldukça kararsız tahminlere yol açacaktır.

Sorum çok basit: "İlgili tüm tahmin edicileri dahil etme" varsayımı / tavsiyesi sadece "söylediğimiz" ama asla demek istediğimiz bir şey değil mi? Değilse, neden gerçek modelleme tavsiyesi olarak veriyoruz?

Ve bu, çoğu katsayının muhtemelen yanıltıcı olduğu anlamına mı geliyor? (örneğin, sadece birkaç öngörücü kullanan kişilik faktörleri ve depresyon üzerine bir çalışma). Başka bir deyişle, bilimlerimizin sonuçları için bu ne kadar büyük bir problemdir?


6
Bu argümanın bir versiyonu 19. yüzyıl boyunca psikoloji, ekonomi ve sosyal bilimlerde yaygındı. Bilim adamları, istatistiksel yöntemlerin insanlar ve sosyal sistemler için uygulanamaz olduğunu çünkü insanlar çok çeşitli ve karmaşık olduklarını iddia ettiler. O yüzyılın sonunda, felsefe üzerinde fayda kazandı: tüm öngörücüler dahil edilmese bile, hala çok şey öğrenebiliriz. Başlık cümlesine "ilgili" ifadesinin dahil edilmesinde bilgelik vardır.
whuber

Yanıtlar:


18

Haklısınız - "ilgili tüm öngörücüler" demede nadiren gerçekçiyiz. Pratikte biz varyasyonun önemli kaynaklar açıklamak yordayıcılarını dahil memnun olabilir . Gözlemsel bir çalışmada bir risk faktörü veya tedavisi hakkında çıkarım yapma özel durumunda, bu nadiren yeterince iyidir. Bunun için, sonuçla ilgili olabilecek ve tedavi seçimi veya tanıtmaya çalıştığınız risk faktörü ile ilişkili olabilecek değişkenler de dahil olmak üzere karıştırıcı düzenlemenin oldukça agresif olması gerekir .Y

Normal lineer modelde, özellikle dahil edilen ortak değişkenlerin ortogonal olması durumunda, ihmal edilen ortak değişkenlerin sadece hata terimini genişlettiği düşünülebilir. Doğrusal olmayan modellerde (lojistik, Cox, diğerleri) değişkenlerin ihmal edilmesi, modele dahil olan tüm değişkenlerin etkilerini saptayabilir (örneğin, oran oranının çökmemesinden dolayı).


Yardımcı bilgiler için teşekkür ederim. Tedavi etkilerini değerlendirmeyi bir kenara bırakarak, bu sorunun pragmatik sonuçları hakkında daha fazla soru sormak istiyorum. Bir makaleyi gözden geçirdiyseniz ve açıkça belirtilmiş önemli öngörücüler varsa, bu reddedilme nedenleri olabilir mi? Bunu soruyorum çünkü a.) Bunu hiç duymadım ve b.) Sosyal bilimciler genellikle SADECE hakkında daha fazla bilgi edinmek istedikleri (yani çalışmanın konusu) öngörücüleri ve "zaten bilinen" faktörleri ( daha verimli ölçüm ihtiyacına göre).
ATJ

Örneğin, endojen bir değişken için sadece bir SINGLE öngörücüsüne sahip gizli bir değişken model görmek nadir değildir. Bu, istatistik alanı ile gerçek konu alanlarında uygulanması arasındaki boşluğu ifade ediyor mu?
ATJ

6
Muhtemelen öyle. Daha önceki soruya reddedilme gerekçeleri, dahil edilen değişkenlerin farklı bir yorumunu verecek veya modeli büyük ölçüde değiştirecek önemli değişkenlerin ihmal edilmesini içerecektir. Bir keresinde akciğer kanseri riski ile ilgili olarak sadece bir deneğin sigara içip içmediğini öğrenmiş olan bir makaleyi gözden geçirdim ve yazarlar sigara dozunu (örneğin, paket yılları) değerlendirmeye çalışmadılar. Kesinlikle reddedilmesini tavsiye ettim.
Frank Harrell

9

Evet, tüm "ilgili değişkenleri" dahil etmelisiniz, ancak bu konuda akıllı olmalısınız. Olgunuzun etkisini, gerçek dünyada (sınıf odasının aksine) araştırmada bol olan ilgisiz şeylerden izole edecek deneyleri inşa etmenin yollarını düşünmelisiniz. İstatistiklere girmeden önce, istatistiklerde değil, alan adınızda ağır kaldırma yapmanız gerekir.

Tüm ilgili değişkenleri dahil etme konusunda alaycı olmamanızı tavsiye ederim, çünkü bu sadece asil bir amaç değil, aynı zamanda genellikle mümkündür. Bunu sadece söylemek uğruna söylemiyoruz. Gerçekten demek istiyoruz. Aslında, tüm ilgili değişkenleri içerebilen deneyler ve çalışmalar tasarlamak, bilimi gerçekten ilginç kılan ve mekanik kazan plakası "deneylerinden" farklı olan şeydir.

İfademi motive etmek için, size Galileo'nun ivme üzerine nasıl çalıştığına dair bir örnek vereceğim. İşte gerçek bir denemenin açıklaması ( bu web sayfasından ):

Yaklaşık 12 cubits uzunluğunda, yarım cubit genişliğinde ve üç parmak genişliği kalınlığında bir parça tahta kalıplama veya kaplama; kenarında bir kanal birden fazla parmağından biraz daha geniş kesildi; bu oluğu çok düz, pürüzsüz ve cilalı hale getirip, parşömenle kaplamış, mümkün olduğunca pürüzsüz ve cilalı olarak, sert, pürüzsüz ve çok yuvarlak bir bronz top yuvarladık. Bu tahtayı eğimli bir konuma yerleştirdikten sonra, bir ucu bir veya iki küpü diğerinin üzerine yükselterek, sadece şu anda açıklanacak şekilde, gerekli zamanı belirterek, kanal boyunca, dediğim gibi topu yuvarladık. iniş yapmak. İki gözlem arasındaki sapmanın nabız atımının onda birini geçmemesi için zamanı doğru bir şekilde ölçmek için bu deneyi bir kereden fazla tekrarladık. Bu işlemi gerçekleştirdikten ve güvenilirliğinden emin olduktan sonra, artık topu kanalın uzunluğunun sadece dörtte biri kadar yuvarladık; ve iniş zamanını ölçtükten sonra, tam olarak ilkinin yarısını bulduk. Daha sonra başka mesafeleri denedik, tüm uzunluk için olan süreyi yarıya kadar olan zamanla, ya da üçte iki ya da dörtte üçü ya da gerçekten herhangi bir fraksiyon için karşılaştırdık; yüzlerce kez tekrarlanan bu tür deneylerde, her zaman geçen boşlukların birbirine zamanın kareleri olarak olduğunu bulduk ve bu, düzlemin, yani boyunca yuvarladığımız kanalın tüm eğimleri için doğruydu. top. Ayrıca, iniş zamanlarının, düzlemin çeşitli eğilimleri için, daha sonra göreceğimiz gibi, bu oranı tam olarak birbirine bağladığını gözlemledik.

Zamanın ölçülmesi için, yükseltilmiş bir konuma yerleştirilmiş büyük bir su kabı kullandık; bu kabın dibine, kanalın tüm uzunluğu veya uzunluğunun bir kısmı için, her bir iniş sırasında küçük bir bardakta topladığımız ince bir su jeti veren küçük çaplı bir boru lehimlenmiştir; bu şekilde toplanan su, her inişten sonra çok hassas bir dengede tartıldı; bu ağırlıkların farkları ve oranları bize zamanların farklarını ve oranlarını verdi ve bu o kadar doğru ki, operasyon birçok kez tekrarlanmasına rağmen, sonuçlarda kayda değer bir tutarsızlık yoktu.

d=gt2,
dgtd0=1t0ditid0/dit02/ti2. Eğer modeli haklı olsaydı o zaman olurdu
d0di=t02ti2

Zamanı nasıl ölçtüğüne dikkat edin. O kadar kaba ki, bu gün doğal olmayan bilimlerin değişkenlerini nasıl ölçtüğünü, "müşteri memnuniyetini" veya "faydayı" nasıl düşündüğünü hatırlatıyor. Ölçüm hatasının bir zaman biriminin onda biri içinde olduğunu söyler, btw.

İlgili tüm değişkenleri içeriyor mu? Evet yaptı. Şimdi, tüm bedenlerin yerçekimi ile birbirine çekildiğini anlamalısınız. Bu nedenle, teoride top üzerindeki kesin kuvveti hesaplamak için evrendeki her bedeni denkleme eklemelisiniz. Dahası, daha da önemlisi, yüzey direnci, hava sürüklemesi, açısal momentum vb. İçermiyordu. Bunların hepsi ölçümlerini etkiledi mi? Evet. Ancak, çalıştığı şeyle ilgili değildi, çünkü çalıştığı mülkün etkisini izole ederek etkilerini azaltabilir veya ortadan kaldırabildi.

t2


Onun zaman ölçümü yöntemiyle ilgili bu kadar kaba olan nedir? Kurulum, suyun büyük kabı terk edeceği ve fincana gireceği belirli bir orana sahip olacaktır; kabın büyük miktarda su içerdiği varsayılarak, bu oran minimum düzeyde değişecektir. Daha da önemlisi, deneyler arasında tutarlı kalacaktır. Aslında o zamanlar kronometreleri ve fantezi otomatik zamanlayıcıları olmadığı için çok şık bir yöntem.
JAB

@JAB, elbette sadece saati ölçmek veya zamanı ölçmek için modern yollarla karşılaştırıldığında kaba. Galileo'nun günlerinde zaman ölçümü sanatının göz önüne alındığında çok zarif olduğu konusunda kesinlikle haklısınız. Bununla birlikte, vurguladığım nokta, bu kadar düşük bir hassasiyetin (aralığın 1 / 10'u) bile zaman ve mesafe arasındaki ilişkiyi gözlemlemek için yeterliydi
Aksakal

@JAB, fizikteki saçma ölçüm yöntemlerinin en sevdiğim örneklerinden biri Cherenkov'un radyasyonunu nasıl keşfettiğidir . Gözleri karanlığa ayarlanıncaya kadar karanlık bir odada otururdu, sonra ışık kaybolana kadar ondan gelen ışıkla deliği açar ya da kapatırdı. Radyasyon seviyesini tespit etmek için ne kadar delik açıldığını kaydediyordu. Görünüşe göre, insan gözü bir avuç fotonda ölçülen ışık farkını tespit edebilir! Kağıt 3 sayfa uzunluğunda.
Aksakal

6

Regresyon modelinin varsayımlarının mükemmel bir şekilde geçerli olması için, ilgili tüm öngörücüler dahil edilmelidir. Ancak hiçbir istatistiksel analizdeki varsayımların hiçbiri mükemmel bir şekilde geçerli değildir ve istatistiksel uygulamaların çoğu "Yeterince Kapat" a dayanmaktadır.

Deney tasarımı ve uygun randomizasyon ile modellerde yer almayan terimlerin etkisi genellikle göz ardı edilebilir (rasgeleleştirme şansına eşit olduğu varsayılır). Ancak, regresyon genellikle modele dahil edilmeyen tüm olası değişkenleri açıklamak için tam randomizasyon mümkün olmadığında kullanılır, bu nedenle sorunuz önemli hale gelir.

Uygun olan her regresyon modelinde muhtemelen bazı potansiyel öngörücüler eksiktir, ancak daha fazla açıklama yapılmaksızın "Bilmiyorum" çalışma istatistiklerinin çalışmaya devam etmesine izin vermeyecektir, bu yüzden elimizden gelenin en iyisini yapıyoruz ve sonra ne kadar fark yaratmaya çalışacağız varsayımlar ve gerçeklik arasındaki sonuçlarımızı etkileyecektir. Bazı durumlarda varsayımlardan fark çok az fark yaratır ve fark hakkında çok endişelenmiyoruz, ancak diğer durumlarda çok ciddi olabilir.

İlgili modelde yer almayan öngörücüler olabileceğini bildiğiniz bir seçenek, duyarlılık analizi yapmaktır. Bu, ölçülemeyen değişken (ler) ile potansiyel ilişkilere dayanarak ne kadar önyargının mümkün olacağını ölçer. Bu kağıt:

Lin, DY ve Psaty, BM ve Kronmal, RA. (1998): Gözlemsel Çalışmalarda Regresyon Sonuçlarının Ölçülmeyen Karşıtlıklara Duyarlılığının Değerlendirilmesi. Biometrics, 54 (3), Eylül, sayfa 948-963.

duyarlılık analizinin bazı araçlarını (ve örneklerini) verir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.