R'de LOESS regresyon modelleri kullanıyorum ve 12 farklı modelin çıktılarını değişen örneklem boyutlarıyla karşılaştırmak istiyorum. Soruyu cevaplamaya yardımcı olursa gerçek modelleri daha ayrıntılı olarak anlatabilirim.
Örnek büyüklükler:
Fastballs vs RHH 2008-09: 2002
Fastballs vs LHH 2008-09: 2209
Fastballs vs RHH 2010: 527
Fastballs vs LHH 2010: 449
Changeups vs RHH 2008-09: 365
Changeups vs LHH 2008-09: 824
Changeups vs RHH 2010: 201
Changeups vs LHH 2010: 330
Curveballs vs RHH 2008-09: 488
Curveballs vs LHH 2008-09: 483
Curveballs vs RHH 2010: 213
Curveballs vs LHH 2010: 162
LOESS regresyon modeli, her beyzbol sahasının X konumu ve Y konumunun sw, sallanma çarpma olasılığını tahmin etmek için kullanıldığı bir yüzeye uygundur. Bununla birlikte, bu modellerin 12'sinin hepsinin karşılaştırmasını yapmak isterim, ancak aynı aralıkların ayarlanması (yani span = 0.5) çok geniş bir örneklem büyüklüğü aralığı bulunduğundan farklı sonuçlar doğuracaktır.
Temel sorum şu, modelinizin kapsamını nasıl belirlersiniz? Daha yüksek bir açıklık, oturumu daha da düzleştirir, düşük bir açıklık ise daha fazla eğilim yakalar, ancak çok az veri varsa istatistiksel gürültü çıkarır. Daha küçük örnek boyutları için daha yüksek bir yayılma alanı ve daha büyük örnek boyutları için daha düşük bir yayılma alanı kullanıyorum.
Ne yapmalıyım? R'deki LOESS regresyon modelleri için span ayarı yapılırken iyi bir kural nedir? Şimdiden teşekkürler!