Belirli varsayımlar yapıldığında AIC ve sırt regresyonu uyumlu hale getirilebilir. Bununla birlikte, sırt regresyonu için bir büzülme seçmenin tek bir yöntemi yoktur, dolayısıyla ona AIC'yi uygulamak için genel bir yöntem yoktur. Ridge regresyonu, Tikhonov düzenlemesinin bir alt kümesidir . Tikhonov regülarizasyonuyla, örneğin için yumuşatma faktörleri seçilerek uygulanabilir birçok kriter vardır, bakınız bu . Bu bağlamda AIC kullanmak için olduğu gibi, bu düzene bağlama nasıl gerçekleştirileceği oldukça spesifik varsayımlar yapan bir kağıt var hasta sorunların ters şartlandırılmış çözümü için Bilgi karmaşıklığı tabanlı düzenlilestirme parametre seçimi . Özellikle, bu
"İstatistiksel bir çerçevede, ... normalleştirme parametresi α değerini seçerek ve maksimum cezalandırılmış olabilirlik (MPL) yöntemini kullanarak .... Korunmasız Gauss gürültüsünü varyans ile ele alırsak ve cezasını kullanırsak karmaşık bir norm, yukarıdaki bağlantıya bakın , MPL çözümü, Tikhonov (1963) düzenli çözümü ile aynıdır. "σ2p(x)=
O zaman soru, bu varsayımlar yapılmalı mı? Gereken serbestlik derecesi sorunu, AIC ve sırt regresyonunun tutarlı bir bağlamda kullanılıp kullanılmadığı sorusuna ikincildir. Ayrıntılar için bağlantıyı okumanızı öneririm. Sorudan kaçmıyorum, sadece sırt hedefleri olarak birçok şey kullanabilir, örneğin, AIC'nin kendisini optimize eden yumuşatma faktörünü kullanabilir . Yani, iyi bir soru diğerini hak ediyor, "Neden sırt bağlamında AIC ile uğraşalım?" Bazı sırt regresyon bağlamlarında, AIC'nin nasıl alakalı hale getirilebileceğini görmek zordur. Örneğin, sırt regresyon göre en aza indirmek için tatbik edilmiştir hata yayılma ve , dk,b[SD(b)b] tarafından verilen gama dağılımının (GD)
GD(t;a,b)=1te−bt(bt)aΓ(a);t≥0,
bu kağıda göre . Özel olarak, bu zorluk bu yazıda, bu etki, çünkü ortaya çıkan, bir rea u nder zaman Cı optimize edilir urve (AUC), ve iyiliğinin maksimum ihtimal (ML) ölçülen zaman örnekleri arasında uyum sağlar . Açıkçası, bunun nedeni AUC'nin kötü konumlandırılmış bir integraldir ve aksi takdirde, örneğin ML kullanarak, gama dağılımı uyumu sağlamlıktan yoksundur. Dolayısıyla, bu özel uygulama için, maksimum olasılık, dolayısıyla AIC aslında önemsizdir. (AIC'nin tahmin için ve BIC'nin uyum iyiliği için kullanıldığı söylenir. Bununla birlikte, tahmin ve uyum iyiliği, sadece oldukça dolaylı olarak AUC'nin güçlü bir ölçüsü ile ilişkilidir.)[0,∞)[t1,tn]
Cevabı için de söz konusu , soru metinde birinci referans der temel nokta not etmek" olduğunu azalan bir fonksiyonudur [ Sic ile, yumuşatma faktörü] [ Sic , etkili bir sayı parametrelerden en] aşağıdaki, şapka matrisinin izini sürmek ve az ." Bu, parametre sayısına eksi tahmin edilen miktar sayısına eşit olduğu anlamına gelir, bu da regresyon normal olmayan en küçük kareler ile aynı olduğunda vedfλd f = p λ = 0 d f = 0 λ = ∞ d f d f ∞ d fdf=pλ=0df=0λ=∞dfdf yumuşatma faktörü artar . Sonsuz yumuşatma için fitin, hangi yoğunluk fonksiyonunun uygun olduğuna bakılmaksızın düz bir çizgi olduğunu unutmayın. Son olarak, tam sayısının bir işlev olduğu.∞df
"Biri,
) olduğunu ; burada { }, özdeğerleridir ." İlginçtir, aynı referans şapka matrisinin izi olarak tanımlar , bkz. def .dfridge=∑(λi/(λi+λλiXTXdf