Ben kullanımı ile serpmek başlıyorum glmnet
ile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum:
age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7)
gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0)
bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88)
m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1)
p_edu <- c(0, 2, 2, 2, 2, 3, 2, 0, 0)
f_color <- c("blue", "blue", "yellow", "red", "red", "yellow", "yellow",
"red", "yellow")
asthma <- c(1, 1, 0, 1, 0, 0, 0, 1, 1)
# df is a data frame for further use!
df <- data.frame(age, gender, bmi_p, m_edu, p_edu, f_color, asthma)
Yukarıdaki veri kümesindeki sütunlar (değişkenler) aşağıdaki gibidir:
age
(yıllardaki çocuğun yaşı) - sürekligender
- ikili (1 = erkek; 0 = kadın)bmi_p
(BMI yüzdelik) - süreklim_edu
(annenin en yüksek eğitim seviyesi) - sıra (0 = liseden daha az; 1 = lise diploması; 2 = lisans derecesi; 3 = bakalorya derecesi)p_edu
(baba en yüksek eğitim seviyesi) - sıra (m_edu ile aynı)f_color
(favori ana renk) - nominal ("mavi", "kırmızı" veya "sarı")asthma
(çocuk astım durumu) - ikili (1 = astım; 0 = astım yok)
Bu örneğin amacı, 6 potansiyel belirleyici değişkenlerin (listesinden bir modeli tahmin çocuk astım durumunu oluşturmak için kement faydalanmak için age
, gender
, bmi_p
, m_edu
, p_edu
, ve f_color
). Açıkçası, örneklem büyüklüğü burada bir sorun, ancak glmnet
sonuç ikili olduğunda (1 = astım ) farklı değişken türlerinin (yani sürekli, sıralı, nominal ve ikili) nasıl ele alınacağı hakkında daha fazla bilgi edinmeyi umuyorum. ; 0 = astım yok).
Bu nedenle, R
astım durumunu tahmin etmek için LASSO'yu yukarıdaki verilerle kullanan bu sahte örnek için açıklamalar ile birlikte örnek bir komut dosyası hazırlamaya istekli olan var mı? Her ne kadar çok temel olsa da, ben biliyorum ve muhtemelen CV'deki birçok kişi bunu çok takdir edecektir!
glmnet
ikili sonucu olan bir eylem örneği görmek istedim .
dput
bir ayağı olarak kaydettiyseniz, daha fazla şans elde edebilirsiniz ; okurların üzerine krema koyup sakın kek yapmayın! Eğer uygun veri çerçevesini R içinde oluşturursanız, diyelimfoo
, sonra çıktısını soruda düzenleyindput(foo)
.