Bir regresyon modelinden ne zaman terim bırakılır?


20

Aşağıdakilerin anlamlı olup olmadığı konusunda herkes tavsiyede bulunabilir mi?

4 öngörücülü sıradan bir doğrusal model ile uğraşıyorum. En az önemli terimi bırakıp bırakmamam iki aklımdayım. It adlı -değeri 0.05 biraz fazla olduğunu. Bu satırlar boyunca bırakmayı tercih ettim: Bu terimin tahmininin (örneğin) bu değişken için örnek verilerinin çeyrekler arası aralığı ile çarpılması, bu terimin korunmasının genel model üzerindeki klinik etkisine bir anlam kazandırır. . Bu sayı çok düşük olduğundan, değişkenin klinik bir ortamda ölçerken alabileceği tipik gün içi değer aralığına eşit olduğundan, klinik olarak anlamlı olmadığını görüyorum ve bu nedenle daha cimri bir model vermek için bırakılabilir. düşürmekle birlikte ayarlanan biraz azaltır .R 2pR2


1
neden daha parsimonius modeli arıyorsun?
Michael Bishop

3
Parsimony kendi içinde iyi bir şey değil mi? Gördüğüm şekilde, klinik anlamda açıklayıcı güç ekleyen veya hiç açıklayıcı güç eklemeyen değişkenleri olan bir model, bu değişkenler istatistiksel anlamda anlamlı olsa bile, bu değişkenleri olmayan daha küçük bir modelden daha kötü
P Sellaz

Bir cevap yazmaya karar verdim: stats.stackexchange.com/questions/17624/… . Ama kısacası, Hayır, cimriğin kendi içinde iyi bir şey olduğunu düşünmüyorum. Bazen belirli nedenlerle faydalıdır.
Michael Bishop

1
Michael'a katılıyorum. "Anlamlı" olma şansı verildiyse, belirgin bir açıklayıcı yeteneği olmayan değişkenleri dahil etmek en iyisidir; zaten bu özgürlük derecelerini geçirdin.
Frank Harrell

Önemli regresör olmayan prediktörlerin, diğer regresörleri etkileyerek, ilişkili regresörler durumunda açıklanan varyansa hala sıfır olmayan miktarlarda katkıda bulunabileceğini unutmayın. Özellikle sadece dört öngörücü ile, regresörler korelasyonluysa, anlamlı olmayanı modelde tutmayı tercih ederim.
Torvon

Yanıtlar:


18

Askerlik arzusunu hiç anlamadım. Parsimony aramak, istatistiksel çıkarımın tüm yönlerini yok eder (regresyon katsayılarının sapması, standart hatalar, güven aralıkları, P-değerleri). Değişkenleri korumanın iyi bir nedeni, bunun güven aralıklarının ve diğer miktarların doğruluğunu korumasıdır. Bunu şu şekilde düşünün: sıradan çoklu regresyonda artık iki varyans varyansının iki tarafsız tahmincisi geliştirilmiştir: (1) önceden belirlenmiş (büyük) modelden tahmin ve (2) genelleştirilmiş derecelerin yerine indirgenmiş bir modelden tahmin (azalan) regresyon serbestlik dereceleri için özgürlük (GDF). GDF, aday parametre sayısına nihai "önemli" parametre sayısından çok daha yakın olacaktır.

İşte bunu düşünmenin başka bir yolu. 4 tedaviyi karşılaştırmak için bir ANOVA yaptığınızı ve 4 df F testi yaptırdığınızı varsayalım. Daha sonra bir nedenden dolayı t-testleri kullanarak tedaviler arasındaki çift farklılıklara bakıyorsunuz ve tedavilerin bazılarını birleştirmeye veya kaldırmaya karar verdiniz (bu, 4 manken değişken üzerinde P, AIC, BIC, Cp kullanarak aşamalı seçim yapmakla aynıdır). 1, 2 veya 3 df ile sonuçlanan F-testinde şişirilmiş tip I hatası olacaktır. 4 df'lik orijinal F testi mükemmel bir çokluk ayarı içeriyordu.


3
+1 Parsimony, genellikle çok spesifik bağlamlarda mantıklı olan bir şeydir. Her ikisini de yapmak için yeterli hassasiyete sahipseniz, önyargıya karşı hassas oyunu oynamak için hiçbir neden yoktur.
Fomite

2
Harika bir cevap için +1. Peki ya çoklu doğrusallık varsa ve bir değişkeni kaldırmak onu azaltırsa? (Bu orijinal sorudaki durum değildir, ancak genellikle diğer verilerdedir). Ortaya çıkan model genellikle her türlü yolla daha üstün değil mi (tahmin edicilerin varyansını azaltın, altta yatan teoriyi yansıtma olasılığı daha yüksek olan katsayı belirtileri, vb.)? Hala doğru (orijinal model) serbestlik derecelerini kullanıyorsanız.
Peter Ellis

4
Her iki değişkeni de dahil etmek daha iyidir. Ödediğiniz tek fiyat, değişkenin diğeri için düzeltilmiş etkilerinden birini tahmin etmede artan standart hatadır. İki doğrusal değişkenin ortak testleri, birbirleriyle rekabet etmek yerine güçleri birleştirdikleri için çok güçlüdür. Ayrıca bir değişkeni silmek isterseniz, veriler hangisini sileceğinizi söyleyemez.
Frank Harrell

17

Değişken seçimiyle ilgili bu cevapların tümü, değişkenlerin gözlem maliyetinin 0 olduğunu varsayar.

Ve bu doğru değil.

Belirli bir model için değişken seçimi konusu seçimi içerebilir veya içermeyebilir, ancak gelecekteki davranışlar için sonuçlar seçimi içerir.

NFL'de hangi üniversite yan hakeminin en iyisini yapacağını tahmin etme problemini düşünün. Sen bir izcisin. NFL'deki mevcut linemenlerin hangi niteliklerinin başarılarını en çok öngördüğünü düşünmelisiniz. 500 miktarı ölçersiniz ve gelecekte ihtiyaç duyulacak miktarları seçme görevine başlarsınız.

Ne yapmalısın? 500 kadarını da muhafaza etmeli misin? Bazıları (astrolojik işaret, doğduğu gün) ortadan kaldırılmalı mı?

Bu önemli bir soru ve akademik değil. Verilerin gözlemlenmesi için bir maliyet söz konusudur ve maliyet etkinliği çerçevesi, bazı değişkenlerin gelecekte gözlemlenmeleri GEREKMEMEKTEDİR, çünkü değerleri düşüktür.


4
+1: önemli ve ilginç bir nokta. Ayrıca sorunun eksik olduğunu ortaya koymaktadır, çünkü modelin amacını belirtmemektedir. (Maliyetler, açıklayıcı bir teori oluşturmayı amaçlayan ancak tekrarlanan kullanım için öngörülü bir modelde öne çıkacak bilimsel bir model için daha az alakalı olacaktır.)
Whuber

6

Değişken tutmanın en az iki olası nedeni daha vardır: 1) DİĞER değişkenlerin parametrelerini etkiler. 2) Küçük olması kendi başına klinik olarak ilginçtir

Yaklaşık 1 görmek için, modeldeki değişkenli ve modelsiz bir modelden her bir kişi için öngörülen değerlere bakabilirsiniz. Bu iki değer kümesinin dağılım grafiğini oluşturmanızı öneririm. Büyük farklar yoksa, bu nedenle bu nedenle bir argüman

2 için, bu değişkenin neden olası değişkenler listesinde bulunduğunu düşünün. Teoriye mi dayanıyor? Diğer araştırmalar büyük bir etki büyüklüğü buldular mı?


Bahsetmek için çok az eşzamanlılık var, bu nedenle bu değişkeni kaldırmak diğerlerine göre çok az fark yaratıyor. Bu küçük olsaydı klinik olarak ilginç olmasıyla ilgili ilginç bir nokta. Veriler, en azından bu aşamada, herhangi bir değişkenin diğerinden daha önemli olmasını beklemek için hiçbir neden bulunmadığı bir araştırma anketinden gelmektedir. Bununla birlikte, bu değişkente gün içi dalgalanma vardır, bu yüzden yüzünde, eğer bir etki bu dalgalanma ile benzer boyuttaysa, benim için klinik olarak anlamlı görünmüyor.
P Sellaz

Tamam, kaldırılmak için iyi bir aday gibi görünüyor.
Peter Flom - Monica'yı eski durumuna döndürün

@P Sellaz - "veriler bir keşif anketinden geliyorsa", bu katılımcıların kendilerini seçtikleri anlamına mı geliyor? @Frank Harrell'in yorumlarını hesaba katacak bir şey buluyorum, ancak örnek kendiliğinden seçildiyse p değerlerinin, güven aralıklarının vb.
rolando2

Bence sadece onları kullanmıyorsanız tartışmalı hale geliyor.
Frank Harrell

@FrankHarrel - lütfen açıklayın: "onları" =?
rolando2

6

Bu günlerde en yaygın tavsiye, iki modelin AIC'sini almak ve daha düşük AIC ile olanı almaktır. Yani, tam modelinizin -20 AIC'si varsa ve en zayıf öngörücüsü olmayan modelin AIC> -20'si varsa, tam modeli korursunuz. Bazıları <3 farkının daha basit olduğunu iddia edebilir. AIC'ler birbirlerinin 3'ü içindeyken "bağları" kırmak için BIC'yi kullanabilmenizi tavsiye ederim.

R kullanıyorsanız, AIC'yi alma komutu ... 'dir AIC.

Burada 90'lı yılların başından itibaren modelleme üzerine önemli olmayan tüm tahmincilerinizi bıraktığınızı gösteren bir ders kitabım var. Ancak bu, öngörücünün modele eklediği veya modelden çıkardığı karmaşıklıktan bağımsız olarak düşeceğiniz anlamına gelir. Aynı zamanda, sadece başka şeylerin açıklandığı şeye göre eğimin büyüklüğü yerine, açıklamanın değişkenlik ile ilgili olduğu ANOVA için de geçerlidir. AIC kullanımının daha modern tavsiyesi bu faktörleri göz önünde bulundurur. Anlamlı olmasa bile, anlamlı olmayan öngörücünün dahil edilmesi gereken her türlü neden vardır. Örneğin, diğer öngörücülerle korelasyon sorunları olabilir, bunun göreceli olarak basit bir öngörücü olabilir. En basit tavsiyeyi istiyorsanız AIC ile gidin ve bağları koparmak için BIC kullanın ve eşitlik pencereniz olarak 3 farkını kullanın.


R temsilinde daha küçük, değil mi?
Aaron - Monica'yı

Cevabın için teşekkürler. İki model arasındaki
AIC'deki farkın

Daha küçük olan model biraz daha büyük bir AIC ve BIC AIC'ye sahiptir: büyük-küçük AIC = -2 BIC: büyük-küçük BIC- 7.8
P Sellaz

Aaron .. ayy ... düşük, sabit ...
John

1
Sadece bir şeyi temizlemek için, bu ek terim sadece bir başka değişkendir ve çok az eşzamanlılık vardır.
P Sellaz

4

Bu modeli ne için kullanıyorsunuz? Parsimony önemli bir hedef midir?

Bazı durumlarda daha cimri modeller tercih edilir, ancak cımbızın kendi içinde iyi bir şey olduğunu söyleyemem. Cimri modeller daha kolay anlaşılabilir ve iletilebilir ve cimri aşırı uyuma karşı korunmaya yardımcı olabilir, ancak çoğu zaman bu konular büyük endişe kaynağı değildir veya başka bir şekilde ele alınabilir.

Bir ters regresyon denkleminde fazladan bir terim dahil olmak üzere zıt yönden yaklaşmak, fazladan terimin kendisinin ilgi çekici olmadığı ve modelin çok fazla uyum sağlamadığı durumlarda bile bazı faydaları vardır ... kontrol edilmesi gereken önemli bir değişkendir, ancak diğerleri olabilir. Elbette, bir değişkeni dışlamak için çok önemli başka önemli nedenler vardır, örneğin, sonuçtan kaynaklanıyor olabilir.


3

İfadelerinizden, son tahmin ediciyi bırakma eğilimindeymişsiniz gibi gelir, çünkü tahmin değeri düşüktür; bu öngörücü üzerinde yapılan önemli bir değişiklik, yanıt değişkeni üzerinde önemli bir değişiklik anlamına gelmez. Bu durumda, o zaman belirleyiciyi dahil etmek / bırakmak için bu kriteri beğendim. Pratik gerçekliğe AIC veya BIC'den daha fazla dayanır ve bu araştırma için kitlenize daha açıklanabilir.


Evet, tam olarak bunu kastettim.
P Sellaz
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.