Regresyon modellerinin çapraz doğrulamasında model kararlılığı


10

Lojistik regresyonun çoklu çapraz-validasyon katları ve her bir regresyon katsayısının sonuçta ortaya çıkan çoklu tahminleri göz önüne alındığında, bir öngörücünün (veya bir dizi belirleyicinin) regresyon katsayılarına göre kararlı ve anlamlı olup olmadığı nasıl ölçülmelidir? ? Bu doğrusal regresyon için farklı mıdır?


@BGreene Çok zeki. Neden cevap olarak göndermiyorsun? Ayrıca topluluk öğrenme literatürünün alakalı bir şey içerip içermediğini merak ediyorsun.
Jack Tanner

"Birden çok çapraz doğrulama" derken, katında k katlamalı çapraz doğrulama yaptığınızı mı kastediyorsunuz ? mk
boscovich

@andrea, "çoklu çapraz doğrulama kıvrımları", yani kıvrımları diyorum . k
Jack Tanner

Yanıtlar:


2

CV'deki her test katlamasından kaynaklanan regresyon katsayılarını bağımsız gözlemler olarak ele alabilir ve daha sonra Shrout & Fleiss tarafından bildirildiği gibi sınıf içi korelasyon katsayısını (ICC) kullanarak güvenilirlik / kararlılıklarını hesaplayabilirsiniz.


0

Çapraz doğrulamanızda, verileri bir eğitim seti ve bir test seti olmak üzere iki bölüme ayırdığınızı varsayıyorum. Bir kat halinde eğitim setinden bir model takıyorsunuz ve bunu test setinin yanıtını tahmin etmek için kullanıyorsunuz, değil mi? Bu, tek bir öngörücü için değil, tüm model için bir hata oranı verecektir.

Sıradan lineer regresyonda kullanılan F-testleri gibi bir şey kullanarak öngörücüler için p-değerleri bulmanın mümkün olup olmadığını bilmiyorum.

Hedefiniz buysa, geri veya ileri seçimi kullanarak modelden öngörücüleri kaldırmayı deneyebilirsiniz.

CV yerine, her bir tahminci için bir güven aralığı bulmak için bootstrap kullanabilirsiniz ve daha sonra ne kadar kararlı olduğunu görebilirsiniz.

CV'nizde kaç kat kullanıyorsunuz, bir kerelik bir çapraz doğrulama mı?

Belki de amacınızın ne olduğuna dair daha fazla ayrıntı bu soruyu cevaplamaya yardımcı olacaktır.


Bunun bir defalık olduğunu varsayın. Her kattaki her bir belirleyicinin zaten bir güven aralığı vardır, örneğin, glm(..., family="binomial")R'deki Bayes posterior CI veya std err'sinden.
Jack Tanner
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.