Aklımda belirli bir örnek veya görevim yok. Ben sadece b-spline'ları kullanma konusunda yeniyim ve regresyon bağlamında bu işlevi daha iyi anlamak istedim.
Yanıt değişkeni ile bazı belirleyicileri arasındaki ilişkiyi değerlendirmek istediğimizi varsayalım . Öngörücüler bazı sayısal değişkenlerin yanı sıra bazı kategorik değişkenleri içerir.
Diyelim ki bir regresyon modeli takıldıktan sonra, örneğin sayısal değişkenlerden biri önemlidir. Sonrasında mantıklı bir adım , ilişkiyi aşırı sığmadan yeterince açıklamak için daha yüksek mertebeden polinomların örneğin: ve gerekip gerekmediğini değerlendirmektir .
Sorularım:
Hangi noktada b-spline'lar veya basit üst düzey polinomlar arasında seçim yaparsınız. örneğin R'de:
y ~ poly(x1,3) + x2 + x3
vs
y ~ bs(x1,3) + x2 + x3
Bu ikisi arasındaki seçiminizi bildirmek için grafikleri nasıl kullanabilirsiniz ve arazilerden çok açık değilse ne olur (örneğin: çok miktarda veri noktası nedeniyle)
Nasıl arasında iki yönlü etkileşim terimlerini değerlendiriyorsunuz ve diyelim kix 3
Yukarıdakiler farklı model türleri için nasıl değişir?
Asla yüksek dereceli polinomları kullanmayı ve daima b-spline'larını takmayı ve yüksek esnekliği cezalandırmayı düşünür müsünüz?
mgcv
olduğu göz önüne alındığında , neden (genelleştirilmiş) katkı modelleri kullanılmıyor? Pürüzsüzlük seçimi otomatiktir ve çıkarımsal yöntemler iyi gelişmiştir.