Değişken önem sıralaması söz konusu olduğunda (her çeşit çok değişkenli modeller bağlamında) bir nihilist oldum .
Genelde, çalışmalarım sırasında, başka bir ekibin değişken öneme sahip bir sıralama yapmasına ya da kendi işimden değişen bir öneme sahip bir grup oluşturmasına yardımcı olmam isteniyor. Bu taleplere cevap olarak aşağıdaki soruları soruyorum
Bu değişken önem derecesinin ne için olmasını istersiniz? Bundan ne öğrenmeyi umuyorsun? Ne tür kararlar kullanmak istersiniz?
Aldığım cevaplar neredeyse her zaman iki kategoriden birine giriyor
- Modelimdeki farklı değişkenlerin cevabı tahmin etmedeki önemini bilmek isterim.
- Düşük önem taşıyan değişkenleri kaldırarak özellik seçimi için kullanmak istiyorum.
İlk cevap tautological (Değişken önem derecesini istiyorum, çünkü değişken önem derecesini istiyorum). Bu sıralamaların çok değişkenli bir modelin çıktısını tüketirken psikolojik bir ihtiyacı doldurduğunu varsaymalıyım. Bunu anlamakta zorlanıyorum, çünkü "önem" değişkenlerini ayrı ayrı sıralamak, söz konusu modelin çok boyutlu yapısını dolaylı olarak reddediyor gibi görünüyor.
İkinci tepki temelde , istatistiksel günahları CrossValidated'ın diğer bölümlerinde iyi belgelendirilmiş resmi olmayan bir geriye dönük seçim versiyonuna indirgenmiştir.
Ayrıca önem derecelerinin kötü tanımlanmış doğası ile de mücadele ediyorum. Sıralamanın neyin ölçülmesi gerektiği konusunda çok az bir anlaşmaya varılıyor ve onlara çok özel bir lezzet veriyor. Bir önem puanı veya sıralaması atamanın birçok yolu vardır ve bunlar genellikle dezavantajları ve uyarıları çekerler:
- Rasgele ormanlarda ve gbms'deki önem derecelerinde olduğu gibi algoritmaya oldukça bağımlı olabilirler.
- Son derece yüksek bir varyansa sahip olabilirler ve temel verilere göre sapmalarla büyük ölçüde değişebilirler.
- Girdi yordayıcılarındaki korelasyondan büyük ölçüde zarar görebilirler.
Öyleyse, tüm söylenenlerle birlikte benim sorum, değişken önem sıralamasının bazı istatistiksel olarak geçerli kullanımları ya da böyle bir arzunun yerine getirilmesinde ikna edici bir argüman (ya istatistikçi ya da meslekten olmayan biri) nedir? Hem genel teorik argümanlar hem de örnek olay incelemesinde hangisinin daha etkili olacağıyla ilgili örnek olaylarla ilgileniyorum.
glmnet
?