Dönüştürülmüş değişkenler kullanılırken doğrusal regresyon etkisi boyutları


9

Doğrusal regresyon gerçekleştirirken, daha iyi normal dağılım uyumu elde etmek için bağımlı değişken için log-dönüşüm gibi bir dönüşüm yapmak genellikle yararlıdır. Genellikle sonuçların etki büyüklüğünü / gerçek ilgisini daha iyi değerlendirmek için beta'ları regresyondan incelemek de yararlıdır.

Bu, örneğin log dönüşümü kullanıldığında, etki boyutlarının log ölçeğinde olacağı ve kullanılan ölçeğin doğrusal olmaması nedeniyle bu betaların geri dönüştürülmesinin anlamlı olmayan değerlerle sonuçlanacağı söylendi. gerçek dünya kullanımı yok.

Şimdiye kadar, önemini incelemek için genellikle dönüştürülmüş değişkenlerle doğrusal regresyon ve daha sonra etki boyutunu belirlemek için orijinal dönüştürülmemiş değişkenlerle doğrusal regresyon gerçekleştirdik.

Bunu yapmanın doğru / daha iyi bir yolu var mı? Çoğunlukla klinik verilerle çalışırız, bu yüzden gerçek bir yaşam örneği, belirli bir maruziyetin boy, kilo veya bazı laboratuvar ölçümleri gibi değişkenleri nasıl etkilediğini belirlemek olacaktır ve "maruz kalma A'nın etkisi vardı ağırlığı 2 kg arttı ".

Yanıtlar:


5

Hatalarınız için normal bir dağılım elde etmek için dönüşümlerin önemli olmadığını öneririm. Normallik gerekli bir varsayım değildir. "Yeterli" verileriniz varsa, merkezi limit teoremi devreye girer ve standart tahminleriniz asimptotik olarak normal hale gelir. Alternatif olarak, önyükleme işlemini standart hataları tahmin etmek için parametrik olmayan bir araç olarak kullanabilirsiniz. (Standart hatalarınızın doğru olması için birimlerdeki gözlemler için ortak bir varyans olan homo-esneklik gereklidir; sağlam seçenekler heteroskedastisiteye izin verir).

Bunun yerine, dönüşümler doğrusal bir modelin uygun olmasını sağlamaya yardımcı olur. Bunu anlamak için, dönüştürülmüş modellerde katsayıları nasıl yorumlayabileceğimizi düşünelim:

  • sonuç birimlerdir, öngörücüler birimlerdir: Tahmincideki bir birim değişiklik, sonuçta beta birim değişikliğine yol açar.
  • birim cinsinden sonuç, log birimindeki yordayıcı: Tahmincideki yüzde bir değişiklik, sonuçta beta / 100 birim değişikliğine yol açar.
  • günlük birimlerinde sonuç, birim olarak kestirimci: Kestirimcideki bir birim değişiklik, sonuçta beta x% 100 değişikliğe yol açar.
  • günlük birimlerinde sonuç, günlük birimlerinde tahminci: Tahmincideki yüzde bir değişiklik, sonuçta yüzde beta değişikliğine yol açar.

Modelinizin mantıklı olması için (yani doğrusallığın tutulması için) dönüşümler gerekiyorsa, bu modelden gelen tahmin, çıkarım için kullanılmalıdır. Bir modelden inandığınız bir tahmin çok yararlı değil. Yukarıdaki yorumlar, dönüştürülmüş bir modelden gelen tahminleri anlamada oldukça yararlı olabilir ve genellikle eldeki soru ile daha ilgili olabilir. Örneğin, ekonomistler log-log formülasyonunu severler çünkü beta yorumlaması bir esnekliktir, ekonomide önemli bir önlemdir.

Arka dönüşümün işe yaramadığını da ekleyeceğim çünkü bir işlevin beklentisi, beklentinin işlevi değildir; beta'nın beklenen değerinin günlüğü, beta günlüğünün beklenen değeri değildir. Bu nedenle, tahminciniz tarafsız değildir. Bu standart hataları da ortadan kaldırır.


2

KISA CEVAP: Kesinlikle doğru, beta değerinin geri dönüşümü anlamsız. Ancak, doğrusal olmama durumunu benzer bir şey olarak bildirebilirsiniz. "100 kg ağırlığındaysanız, günde iki parça kek yemek, bir haftada kilonuzu yaklaşık 2 kg artıracaktır. Bununla birlikte, 200 kg ağırlığınız varsa, kilonuz 2,5 kg artar. Bu doğrusal olmayan ilişkinin tasviri için şekil 1'e bakın ( Şekil 1, ham veri üzerindeki eğrinin oturmasıdır). "

UZUN CEVAP:

Geri dönüştürülmüş değerin anlamlılığı değişir, ancak düzgün bir şekilde yapıldığında genellikle bir anlamı vardır.

0.13 beta ve 7.0 kesişme oranına sahip iki x yordayıcısında doğal log değerlerinde bir gerileme varsa, 0.13 (1.14) geri dönüşümü hemen hemen anlamsızdır. Bu doğru. Ancak, 7.13'ün geri dönüşümü, bir anlam ile yorumlanabilecek bir değer olacaktır. Daha sonra 7.0'ın arka dönüşümünü çıkarabilir ve anlamlı bir ölçekte etkiniz olan bir kalan değerle bırakabilirsiniz (152.2). Öngörülen herhangi bir değere bakmak isterseniz, önce günlük değerlerinde hepsini hesaplamanız ve sonra geri dönüştürmeniz gerekir. Bu, tahmin edilen her değer için ayrı ayrı yapılmalıdır ve grafik halinde bir eğri ile sonuçlanır.

Dönüşümünüzün verileriniz üzerinde nispeten küçük bir etkisi varsa, bu genellikle makul olur. Reaksiyon sürelerinin log dönüşümü, geri dönüştürülebilen bir tür değerdir. Doğru yapıldığında, değerlerin ham veriler üzerinde basit hesaplamalar yaparak medyan değerlere yakın göründüğünü göreceksiniz.

O zaman bile, etkileşimlere ve etkileşimsizliğe dikkat edilmelidir. Göreli değerler ölçeğe göre değişir. Geri dönüştürülen değerler, etkileşimleri orada olmamalı gibi gösteren farklı modeller gösterebilir veya tersi de olsa, günlük değerine duyarlıdır. Başka bir deyişle, dikkatli olduğunuz sürece verilerde küçük değişiklikler yapan şeyleri geri dönüştürebilirsiniz.

Olasılığın lojistik dönüşümü gibi bazı değişikliklerin, özellikle ölçeğin sonuna yakın, oldukça büyük etkileri olabilir. Asla dönüştürmemeniz gereken bir yere örnek olarak, olasılığın yüksek veya düşük ucunun yakınındaki etkileşim grafikleri verilebilir.


2

Soru, sanırım, bireysel katsayıları yorumlamakla ilgili değil, marjinal etkilerle (X'in Y üzerindeki) ilgili olduğunu düşünüyorum. Halkın yararlı bir şekilde belirttiği gibi, bunlar bazen bir etki büyüklüğü ile tanımlanabilir, örneğin doğrusal ve katkı ilişkileri olduğunda.

Odak bu ise, o zaman (kavramsal olarak, pratikte değilse) sorunu düşünmenin en basit yolu şu gibi görünecektir:

Hiçbir etkileşimler ile doğrusal, normal regresyon modelinde Y'de X marjinal etkisini elde etmek için, olabilir sadece değil bilinen tahmin edilmektedir beri oldukça yeterli değil X. But üzerinde katsayısı bak. Her durumda, kişinin marjinal etkiler için gerçekten istediği şey, bir dizi X değeri için Y hakkında bir tahmin ve bir belirsizlik ölçüsü sağlayan bir tür grafik veya özettir. Tipik olarak, tahmin edilen ortalama Y ve bir güven aralığı istenebilir, ancak bir X için Y'nin tam koşullu dağılımı için tahminler de istenebilir. .

Bunun gibi basit modeller için çeşitli kapalı form çözümleri vardır. Mevcut amaçlar için onları görmezden gelebilir ve daha genel olarak keyfi olarak karmaşık modellerle ilgilenecek şekilde bu marjinal efekt grafiğini simülasyonla nasıl elde edeceğinizi düşünebiliriz.

Değişen X'in Y ortalaması üzerindeki etkilerini istediğinizi ve diğer tüm değişkenleri bazı anlamlı değerlerde düzeltmekten mutluluk duyduğunuzu varsayın. X'in her yeni değeri için, model katsayılarının dağılımından B boyutu örneği alın. R'de bunu yapmanın kolay bir yolu, ortalama coef(model)ve kovaryans matrisi ile Normal olduğunu varsaymaktır vcov(model). Her katsayı seti için yeni bir beklenen Y hesaplayın ve lotu bir aralık ile özetleyin. Sonra bir sonraki X değerine geçin.

Bana öyle geliyor ki, her bir örnekleme adımında da onları (veya terslerini) uygulamanız koşuluyla, bu yöntemin değişkenlerden herhangi birine uygulanan herhangi bir fantezi dönüşümden etkilenmemesi gerekir. Dolayısıyla, takılı modelde yordayıcı olarak log (X) varsa, yeni X'inizi örneklenmiş katsayı ile çarpmadan önce günlüğe kaydedin. Takılan model bağımlı bir değişken olarak sqrt (Y) değerine sahipse, bir aralık olarak özetlemeden önce numunedeki tahmini her ortalamanın karesini alın.

Kısacası, daha fazla programlama ancak daha az olasılık hesaplaması ve sonuç olarak klinik olarak anlaşılabilir marjinal etkiler. Bu 'yöntem' bazen siyaset bilimi literatüründe CLARIFY olarak adlandırılır, ancak oldukça geneldir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.