Çapraz doğrulama (CV) ve genelleştirilmiş çapraz doğrulama (GCV) istatistikleri


23

Çapraz doğrulama (CV) istatistiği ve doğrusal bir model Y=Xβ+ε (normal, homoscedastic error vector \ ile) ile ilişkili genelleştirilmiş çapraz doğrulama (GCV) istatistiği için muhtemelen çelişkili tanımlar buldum. cıvataları \ varepsilonε ).

Bir yandan, Golub, Heath ve Wahba GCV tahminini λ^ olarak tanımladı (s. 216).

arasında asgarileştirir V(λ) tarafından verilen

V(λ)=1n(IA(λ))y2(1ntr(IA(λ)))2
burada A(λ)=X(XTX+nλI)1XT

Öte yandan, Efron aynı kavramı V(0) (s. 24) olarak tanımlamaktadır , ancak bu kavramın tanımını temelde aynı olan Craven & Wahba'ya atfeder (s. 377). Golub olarak, Heath & Wahba'nın yukarıda belirtilen tanımı.

Bu, 0'ın V \ left (\ lambda \ right)0 en aza indirdiği anlamına mı geliyor ?V(λ)

Benzer şekilde, Golub, Heath ve Wahba, λ (s. 217) ' nin CV tahminini en aza indirgeyici olarak tanımlamıştır .

P(λ)=1nk=1n([Xβ(k)(λ)]kyk)2

burada β(k)(λ) olan tahmin

β^(λ)=(XTX+nλI)1XTy

ve β ile k inci veri noktası yi çıkartıldı.

Yazarlar, Allen kağıt Yine Allen ( "Allen'in PRESS", aynı eser.) İla (aynı zamanda basın tahmini olarak da adlandırılır) CV tahmininin giriş öznitelik, PRES tahmini tanımlanır (s. 126) olarak nP(0) (Efron'un makalesinde P(0) (s. 24)) olarak tanımlanmıştır.

Yine, bu 0'ın P \ left (\ lambda \ right)0 en aza indirdiği anlamına mı geliyor?P(λ)


  1. Allen, David M. Değişken Seçme ve Veri Toplama Arasındaki İlişki ve Öngörü Yöntemi. Technometrics, Vol. 16, No. 1 (Şubat 1974), sayfa 125-127

  2. Craven, Peter ve Wahba, Grace. Spline Fonksiyonlarıyla Gürültülü Verileri Düzgünleştirme. Numerische Mathematik 31, (1979), sayfa 377-403

  3. Efron, Bradley. Lojistik Bir Regresyonun Görünür Hata Oranı Ne Kadar Önyargılıdır? Teknik rapor no. 232. İstatistik Bölümü, Stanford Üniversitesi (Nisan 1985)

  4. Golub, Gene H., Heath ve Grace Wahba. İyi Bir Ridge Parametresi Seçme Yöntemi Olarak Genelleştirilmiş Çapraz Doğrulama. Technometrics, Vol. 21, No. 2 (Mayıs 1979), sayfa 215-223


7
Bunun, en küçük karelere değil, sırt regresyonuna sahip olacağını söylemeyi unuttun mu? Kâğıt başlıkları görene dekλ
lambda'nın

1
Başlığa Genelleştirilmiş Çapraz Doğrulamayı kaldırın ve başlığa Ridge Regression ekleyin. İşte ne GridSearchCV () RidgeCV için varsayılan ():
HoofarLotusX

Yanıtlar:


2

Yorumların cevabı işaret ettiğine inanıyorum, ancak açıkça belirtmiyor. O yüzden kör olacağım.

Burada verilen V formülü doğrusal sırt regresyonuna özgüdür. PRESS ile aynı olduğunu söylemezler, PRESS'in dönüşü değişmeyen bir versiyonu olduğunu söylerler. "Rotasyon değişmez" kısmı, bunu genelleştiren şeydir.

Efron'un makalesi, bu bağlam için özelleştirilmiş lojistik regresyon ile ilgilidir. İki bağlam arasındaki matematik çevirisini görmek istiyorsanız, okumak için doğru kitap, 2ed, Hastie, Tibshirani ve Freedman tarafından verilen İstatistiksel Öğrenme Öğeleridir. Bu kitabı çevrimiçi olarak ücretsiz sunuyorlar: https://web.stanford.edu/~hastie/Papers/ESLII.pdf . GCV hakkında bir başka yararlı okuma, Simon Wood'un Genelleştirilmiş Katkı Modelleri'dir. Tedavisi genel olarak GCV'yi regresyon ve lojistik regresyondaki uygulamalarla bütünleştirir.

ESL kitabına bakarsanız, s 244, temel olarak aynı sembolojiyi görürsünüz. Pürüzsüz matris olarak sahip olduğunuz o büyük matris ürününe atıfta bulunurlar (bunun bir Şapka matrisi veya yakın bir kuzeni olduğunu söyleyebilirim). Pürüzsüz e eşleme olarak tanımlarlar.Syyy^

y^=Sy

S , verilerdeki her satır için bir tane olmak üzere bir CV bırakma değeri hesaplamak için kullanılabilir. İçin doğrusal modeller , matrisi regresyon teşhis Şapka matrisinin rol oynamaktadır. Bununla birlikte, bunun hesaplanması zor olabilir ya da gereksiz olabilir diyorlar ve GCV yaklaşımı aynı fikrin biraz daha genel bir versiyonu.SS

GCV'nin yaklaştırılması için bir formül sunar :

G,CV(f^)=1N-Σben=1N-[yben-f^(xben)1-trbirce(S)/N-]2

Bu, birçok modelde AIC'ye davranış olarak oldukça benzerdir. parametre etkili bir sayıdır.trbirceS

Eğer alıntı parça daha genel bir iz olduğunu . Anlayabildiğim kadarıyla, soyut GCV'de bir tane çapraz onaylama dışında bırakmanın yaklaşık bir versiyonudur, ancak bazı durumlarda (sırt regresyonuna inanıyorum) kesindir. Golub gazetesinde ana nokta budur.nλS

İyi şanslar, daha fazlasını öğrenirseniz, tekrar yazın.


Teşekkürler. Sorumu 5 yıldan fazla bir süre önce gönderdim ve o zamandan beri bu malzemenin çoğunu unuttum, bu yüzden iyi olup olmadığını (ki göründüğü gibi) ya da kötü olduğunu söylemek için cevabınızı değerlendiremiyorum. Ben de kabul edemem. Yine de gönderdiğiniz için teşekkürler. Umarım bu sayfaya gelebilecek başkaları için faydalı olacaktır.
Evan Aad,
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.