Bishop'un PRML kitabında, aşırı sığmanın Maksimum Olabilirlik Tahmini (MLE) ile ilgili bir sorun olduğunu ve Bayesian'ın bundan kaçınabileceğini söylüyor.
Ama bence, aşırı takma, parametre tahmini yapmak için kullanılan yöntemle değil, model seçimi ile ilgili bir sorundur. Yani, diyelim ki ile oluşturulan bir veri kümesi sahibim, şimdi verilere uymak ve bulmak için farklı modelleri seçebilirim hangisi en iyisi. Ve göz önünde bulundurulan modeller, farklı siparişleri olan polinomlardır, sipariş 1, sipariş 2, sipariş 9'dur.
Şimdi veri 3 modelin her birine uydurmaya çalışıyorum , her modelin parametreleri için olarak belirtiliyor .
, model parametreleri hakkında bir nokta tahminim olacak ve çok basit ve her zaman verilerin altında , çok karmaşık ve verileri , sadece verilere iyi uyacak.
Sorularım,
1) Model verileri geçersiz kılacaktır, ancak bunun ML sorunu olduğunu düşünmüyorum, ancak modelin kendi başına sorunu olduğunu düşünüyorum. Çünkü, için ML kullanmak aşırı neden olmaz. Haklı mıyım?
2) Bayesian ile karşılaştırıldığında, ML'nin bazı dezavantajları vardır, çünkü sadece model parametrelerinin nokta tahminini verir ve fazla güvenlidir. Bayesian parametrenin sadece en olası değerine güvenmemekle birlikte, gözlemlenen veriler verilen parametrelerin tüm olası değerleri değil mi?
3) Bayesian neden aşırı sığmayı önleyebilir veya azaltabilir? Anladığım kadarıyla, model karşılaştırması için Bayesian kullanabiliriz, yani verileri verildiğinde , dikkate alınan her model için marjinal olabilirliği (veya model kanıtını) bulabilir ve sonra en yüksek marjinal olasılığa sahip olanı seçebiliriz, doğru ? Eğer öyleyse, neden böyle?