“Model Belirsizlik” dünyasında bulduğum ilginç şeylerden biri de bu “gerçek model” kavramıdır. Bu, dolaylı olarak, “model önermelerimizin” biçiminde olduğu anlamına gelir:
M(1)i:The ith model is the true model
P(M(1)i|DI)M(1)i
Burada yoruculuk çok önemlidir, çünkü bu olasılıkların 1'e eklenmesini sağlar, bu da modeli marjinalleştirebileceğimiz anlamına gelir.
Fakat bunların hepsi kavramsal seviyede - model ortalama ortalaması iyi bir performans sergiliyor. Yani bu daha iyi bir kavram olması gerektiği anlamına gelir.
Şahsen ben modelleri çekiç, matkap gibi alet olarak görüyorum. Modeller, gözlemleyebileceğimiz şeyler hakkında öngörülerde bulunmak veya açıklama yapmak için kullanılan zihinsel yapılardır. Bir "gerçek çekiç" ten bahsetmek çok garip ve "gerçek bir zihinsel yapıdan" bahsetmek de aynı derecede garip. Buna dayanarak, “gerçek model” kavramı bana çok garip geliyor. "Doğru" modeller ve "yanlış" modeller yerine "iyi" modelleri ve "kötü" modelleri düşünmek çok daha doğal görünüyor.
Bu bakış açısına göre, bir dizi modelden, kullanılacak "en iyi" model konusunda aynı derecede belirsiz olabiliriz. Öyleyse teklifin yerine bunun nedeni olduğumuzu düşünelim:
M(2)i:Out of all the models that have been specified,
the ith model is best model to use
M(2)iM(2)i
Bununla birlikte, bu yaklaşımda, "en iyi" modelinizin ne kadar iyi olduğunu ölçmek için bir çeşit uygun ölçü ölçüsüne ihtiyacınız vardır. Bu, her zamanki GoF istatistiklerini (KL farklılığı, Chi-square, vb.) İfade eden "kesin şey" modelleriyle test ederek iki şekilde yapılabilir. Bunu ölçmenin bir başka yolu, model sınıfınıza son derece esnek bir model eklemektir - belki de yüzlerce bileşenden oluşan normal bir karışım modeli veya bir Dirichlet işlem karışımı. Bu model en iyisi olarak ortaya çıkıyorsa, diğer modellerin yetersiz olması muhtemeldir.
Bu yazının iyi bir teorik tartışması var ve adım adım, aslında model seçimini nasıl yaptığınıza dair bir örnek veriyor.