SAS'ları kullanarak Poisson genel katkı modeli kullanarak bazı zaman serisi verileri uydurdum PROC GAM
. Genel olarak konuşursak, yerleşik genelleştirilmiş çapraz doğrulama prosedürünün, tek bir parametrik terimle birlikte doğrusal olmayan bir zaman fonksiyonu olan tek spline için en azından iyi bir "başlangıç noktası" oluşturmasını sağladım. gerçekten ilgileniyorum).
Şimdiye kadar, veri setlerimden biri hariç, oldukça yüzerek çalıştı. Bu veri setinde 132 gözlem var ve GCV 128 derecelik bir spline öneriyor. Öyle görünüyor ... yanlış. Çok yanlış. Daha da önemlisi, aynı zamanda hiç kararlı değil. Parametrik terimin tahmini değişmeyi bıraktığında, serbestlik dereceleri eklemeyi durdurmak için "Tahmindeki Değişim" kriterleri gibi bir şey kullanarak ikinci bir yaklaşım denedim, çünkü hiçbir şey farklı değilse neden kontrol eklemeye devam ediyorsunuz?
Sorun şu ki, tahminin hiç istikrarlı olmaması. Aşağıdaki serbestlik derecelerini denedim ve görebileceğiniz gibi parametrik terim çılgınca zıplıyor:
DF: Parametric Estimate:
1 -0.76903
2 -0.56308
3 -0.47103
4 -0.43631
5 -0.33108
6 -0.1495
7 0.0743
8 0.33459
9 0.62413
10 0.92161
15 1.88763
20 1.98869
30 2.5223
40-60 had convergence issues
70 7.5497
80 7.22267
90 6.71618
100 5.83808
110 4.61436
128 1.32347
Ben bu özel veri biraz df açısından ne kullanmalıyım hakkında hiçbir sezgi var. Bir df seçmek için başka herhangi bir fikir? Spline'ın önemine bakmalı mıyım?
Df = 10 ve df = 15 arasında biraz daha fazla görünmek, 128 tarafından üretilen tahmine en yakın olan df = 12 gibi görünüyor ve hala "makul derecede serbestlik" aralığında. Doğrusal terim, kesişme ve tek parametrik terim ile birlikte, oldukça ağır doymuş bir model gibi hissediyor. Sadece 12 ile gitmek haklı mı?
İkinci bir güncelleme olarak, düzeltmeyi 'den' spline(t)
e değiştirmek loess(t)
çok daha iyi davranılmış df tahminleri ile sonuçlanır - sadece düzgün olmayan yumuşatmaya geçmeliyim?