Serbestlik dereceleri tam sayı olmayan bir sayı olabilir mi?


27

GAM kullandığımda, artık DF (kodun son satırı) olduğunu gösteriyor. Bu ne anlama geliyor? GAM örneğinin ötesine geçmek, Genel olarak, serbestlik derecelerinin sayısı tam sayı olmayan bir sayı olabilir mi?26,6

> library(gam)
> summary(gam(mpg~lo(wt),data=mtcars))

Call: gam(formula = mpg ~ lo(wt), data = mtcars)
Deviance Residuals:
    Min      1Q  Median      3Q     Max 
-4.1470 -1.6217 -0.8971  1.2445  6.0516 

(Dispersion Parameter for gaussian family taken to be 6.6717)

    Null Deviance: 1126.047 on 31 degrees of freedom
Residual Deviance: 177.4662 on 26.6 degrees of freedom
AIC: 158.4294 

Number of Local Scoring Iterations: 2 

Anova for Parametric Effects
            Df Sum Sq Mean Sq F value    Pr(>F)    
lo(wt)     1.0 847.73  847.73  127.06 1.239e-11 ***
Residuals 26.6 177.47    6.67                      
r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
Genel olarak, evet, df bir kayan nokta sayısı olabilir.
David Lane

6
Muhtemelen gerçek sayıyı (veya tam sayı olmayan bir sayı) sormayı kastediyorsunuz; kayan nokta sayısı, uygulama ile ilgili olan bir bilgisayar kavramıdır (gerçek sayılara yaklaşmanın bir yolu), ancak siz gerçekten altta yatan matematiksel fikirden (ve matematiksel bir soru sormak için daha iyi) soruyorsunuz. Biri genellikle (bir nedenden ötürü, her zaman iyi değil) kavramsal olarak bir tamsayı olan bir miktarın, kayan nokta sayısı olarak depolanan uygulamada olduğu durumlarla karşı karşıya kalır. "Bir modelin tamsayı olmayan serbestlik derecelerine sahip olabilir mi?" başlık için.
Glen_b -Reinstate Monica

Yanıtlar:


40

Özgürlük dereceleri, birçok bağlamda tamsayı değildir. Nitekim birkaç koşullarda özgürlük dereceleri bazı değer arasında olmalıdır bazı belirli modeller için veri sığdırmak için bu kurabilir ve .kk+1

Genellikle serbestlik derecelerini serbest parametrelerin sayısı olarak düşünürüz, ancak parametrelerin tamamen serbest olmadığı ve sayılmasının zor olabileceği durumlar vardır. Bu, örneğin yumuşatırken / düzenlileştirirken olabilir.

Lokal ağırlıklı regresyon / çekirdek metotlarının durumları yumuşatıcı eğri çizgileri böyle bir durumun örnekleridir - toplam serbest parametre sayısı, yordayıcılar ekleyerek kolayca sayabileceğiniz bir şey değildir, bu nedenle daha genel serbestlik dereceleri fikri gerekir.

Gelen Genelleştirilmiş Katkı Modelleri üzerinde gamkısmen dayanır, Hastie ve Tibshirani (1990) [1] (ve aslında çok sayıda diğer referanslarda) yazabiliriz bazı modellerde Y = bir y , serbestlik derecesi zaman olarak kabul edilir tr ( A ) (ayrıca tr ( A A T ) veya tr ( 2 A - A A T ) tartışıyorlar ). Birincisi, her ikisinin de çalıştığı (örneğin regresyonda, normal durumlarda tr ( A) olan daha olağan yaklaşımla tutarlıdır.y^=birytr(bir)tr(birbirT)tr(2bir-birbirT)tr(bir)X sütun boyutu olacaktır), ancakbir simetrik ve belirsiz olduğunda, bu üç formül de aynıdır.

[Ayrıntıları yeterince kontrol etmek için bu referansa sahip değilim; aynı yazarların (ayrıca Friedman'ın) kolayca ele geçirilebilecek bir alternatifi , İstatistiksel Öğrenmenin Öğeleridir [2]; örneğin yumuşatıcı bir eğriliğin etkin serbestlik derecelerini tr(bir) olarak tanımlayan denklem 5.16'ya bakınız (benim yazımda)

Daha genel olarak, hala Ye (1998) serbestlik [3] tanımlanan genel derece Σbeny^benybentr(bir)y^y^benyben

Takılanlar gibi modeller için gam, bu çeşitli önlemler genellikle tam sayı değildir.

(Bazı durumlarda hikaye biraz daha karmaşık hale gelebilse de, bu referansların bu konuyla ilgili tartışmalarını okumanı şiddetle tavsiye ediyorum. Örneğin, [4])

[1] Hastie, T. ve Tibshirani, R. (1990),
Genelleştirilmiş Katkı Modelleri
Londra: Chapman ve Salon.

[2] Hastie, T., Tibshirani, R. ve Friedman, J. (2009),
İstatistiksel Öğrenmenin Öğeleri: Veri Madenciliği, Çıkarım ve Tahmin , 2.Ed
Springer-Verlag.
https://statweb.stanford.edu/~tibs/ElemStatLearn/

[3] Ye, J. (1998),
"Veri Madenciliği ve Model Seçiminin Etkilerinin Ölçülmesi ve Düzeltilmesi Üzerine"
Amerikan İstatistik Kurumu Dergisi , Vol. 93, No. 441, s. 120-131

[4] Janson, L., Fithian, W. ve Hastie, T. (2013),
"Etkili Özgürlük Dereceleri: Kusursuz Bir Metafor"
https://arxiv.org/abs/1312.7851


7
Bu durumla ilgili değildir, ancak varyansların eşit olmadığı durumlarda Welch iki örnek t testi, tam sayı olmayan bir serbestlik derecesine sahip olabilir.
Michael R. Chernick

5
Epsilon düzeltilmiş df olarak tekrarlanan ölçülerde ANOVA olabilir.
David Lane

2
Başka bir referans, statweb.stanford.edu/~tibs/ElemStatLearn/printings/… bölüm 5.4.1 Serbestlik Derecesi ve Daha Düzgün Matrisler
Adrian,

1
@Adrian teşekkürler; Sadece bu referansın eklenip eklenmeyeceğini (özellikle de işaret ettiğiniz bölümde eqn 5.16'dan bahsedilip edilmediğini) araştırıyordum. Bunu eklemenin iyi bir fikir olduğu
sonucuna vardım
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.