Son zamanlarda Pareto'nun önemini belirten örnekleme bırakma-bir-arada çapraz-doğrulama (PSIS-LOO) kullanmaya başladım:
- Vehtari, A. ve Gelman, A. (2015). Pareto önem örneklemesini yumuşattı. arXiv ön baskı ( bağlantı ).
- Vehtari, A., Gelman, A. ve Gabry, J. (2016). Bir defaya mahsus çapraz doğrulama ve WAIC kullanılarak pratik Bayesci model değerlendirmesi. arXiv ön baskı ( bağlantı )
Bu, LOO-CV'nin tek bir MCMC çalışması ile gerçekleştirilmesine izin verdiği ve WAIC gibi mevcut bilgi kriterlerinden daha iyi olduğu için örnek dışı model değerlendirmesine çok cazip bir yaklaşımı temsil eder.
PSIS-LOO, yaklaşımın güvenilir olup olmadığını, yani önem ağırlıklarının ampirik dağılımlarının kuyruklarına takılan tahmini veri üsleri tarafından verilen bir tanılamaya sahiptir (veri noktası başına bir ağırlık). Kısacası, tahmini bir ağırlık , kötü şeyler olabilir.
Ne yazık ki, bu yöntemi benim sorunuma uygularken , ilgi modellerinin çoğunluğu için \ hat {k} _i \ gg 0.7 büyük bir bölümünü buldum bulundu . Şaşırtıcı olmayan bir şekilde, bildirilen LOO log olasılıklarının bazıları oldukça açık bir şekilde saçmalıktı (diğer veri kümelerine kıyasla). Bir çift kontrol olarak, geleneksel (ve zaman alıcı) 10 kat çapraz doğrulama yaptım, yukarıdaki durumda gerçekten PSIS-LOO'nun çok yanlış sonuçlar verdiğini fark ettim (yukarı tarafta, sonuçlar 10 ile çok iyi anlaşmaya vardı. - hepsi ) olan modeller için CV katlayın . Kayıt için Aki Vehtari'nin PSIS-LOO'nun MATLAB uygulamasını kullanıyorum.
Belki de bu yöntemi uyguladığım mevcut ve ilk sorunumun PSIS-LOO için "zor" olması konusunda çok şanssızım, ancak bu davanın nispeten yaygın olabileceğinden şüpheleniyorum. Benimki gibi durumlarda, Vehtary, Gelman & Gabry makalesinde şöyle diyor:
PSIS tahmininin sonlu bir varyasyonu olsa bile, olduğunda, kullanıcı sorunlu için doğrudan den örneklemeyi düşünmelidir , katlama çapraz- doğrulayın veya daha sağlam bir model kullanın.
Bunlar açık ama gerçekten ideal çözümler değil, çünkü zaman alıcıdırlar veya ek uğraşlar gerektirirler (MCMC ve model değerlendirmesinin tamamen uğraşmakla ilgili olduğunu takdir ediyorum , ancak daha az daha iyi).
PSIS-LOO'nun arızalanmasını önlemek için önceden uygulayabileceğimiz genel bir yöntem var mı ? Birkaç belirsiz fikrim var, ama insanların benimsediği ampirik bir çözüm olup olmadığını merak ediyorum.