Uygun puanlama kuralları arasında seçim yapma


22

Uygun puanlama kurallarıyla ilgili çoğu kaynak, log kaybı, Brier puanı veya küresel puanlama gibi farklı puanlama kurallarından bahseder. Ancak, genellikle aralarındaki farklar hakkında çok fazla rehberlik yapmazlar. (Sergi A: Vikipedi .)

Logaritmik skoru maksimize eden modelin seçilmesi, logaritmik skorlamanın kullanılması için iyi bir argüman gibi görünen maksimum olabilirlik modelinin seçilmesine karşılık gelir. Brier veya küresel puanlama veya diğer puanlama kuralları için benzer gerekçeler var mı? Neden birisi bunlardan birini logaritmik puanlama yerine kullanıyor?


2
Bazı ipuçları terminolojide. "Maliyet fonksiyonel" optimizasyon veya optimal kontrol sistemi mühendisliği. "En iyisi" yok. "İyiliğe" sahip olmak, bir iyilik ölçüsüne sahip olmanız gerektiği anlamına gelir. İyiliğin ölçülmesinde sonsuz sayıda aile vardır. Önemsiz bir örnek: En iyi yol nedir? İnfazınıza doğru ilerliyorsanız, onu uzun ve zevkli bir hale getirin. Fields metalinize gidecekseniz, en kısa zamanda yapın. Sistem uzmanlığı, iyiliğin ölçüsünü seçmenize yardımcı olur. İyiliğin ölçüsü olduğunda, "en iyisini" bulabilirsin.
EngrStudent - Monica


1
Başlığı daha kesin / bilgilendirici hale getirmek için düzenleme özgürlüğünü kullandım. Yanlış yorumladıysam özür dilerim ve değişikliği geri almaktan çekinmeyin.
Richard Hardy

Yanıtlar:


18

Neden birisi bunlardan birini logaritmik puanlama yerine kullanıyor?

Yani ideal, her zaman ayırt bir model uydurma gelen bir karar . Bayesian metodolojisinde, modelleme ve seçim her zaman marjinal olasılık kullanılarak yapılmalıdır . Daha sonra olasılıklı tahminler yapmak için modeli kullanırsınız ve kayıp fonksiyonunuz size bu öngörüler üzerinde nasıl davranacağınızı söyler.

Ne yazık ki, gerçek dünyada, hesaplama performansı genellikle model seçimini ve karar alma sürecini bir araya getirmemizi ve dolayısıyla modellerimiz için uygun bir kayıp işlevi kullanmamızı gerektirir. Bu, model seçimindeki öznellikte ürkütücüdür, çünkü ne kadar farklı türden bir hatanın size mal olacağını tahmin etmeniz gerekir. Klasik örnek, kanser için bir teşhis yöntemidir: birinin kanser olasılığını fazla tahmin etmek iyi değildir, ancak bunu daha da kötüleştirmek.

Bir kenara, bir puanlama kuralının nasıl seçileceğine dair rehberlik arıyorsanız, bu iki konu hakkındaki literatürün çok fazla olduğunu düşündüğümden, bir kayıp fonksiyonunu seçme veya bir yardımcı fonksiyon tasarlama konusunda da rehberlik isteyebilirsiniz. daha hacimli.


3
1) Brier puanlamasının esasen "kılık değiştirmiş bir kayıp işlevi" olduğunu mu söylüyorsunuz - yani, bir fayda-işlev-agnostik puanlama / karşılaştırma kuralı olarak maskelenmiş olsa da, aslında insanlar, türleri için özel tercihlere sahip oldukları için kullanılıyor modelin yaptığı hatalar?
Ben Kuhn

2) Bu nedenlerden dolayı, birisinin Brier puanlama veya küresel puanlama üzerinden (veya anladığıma göre marjinal olabilirlik) küresel puanlamayı seçebileceği belirli bir ayar örneğiniz var mı?
Ben Kuhn

3) Neden kayıp / faydalı fonksiyon varsayımlarınızı modele göre marjinal olasılığa uydurmaktan ve aslında karar verirken kayıp / faydalı fonksiyonunuzu kullanmaktan daha iyi bir performans göstersin? İdeal öğrenme algoritmaları için bunlar arasında boşluk olmaması gerektiği gibi görünüyor.
Ben Kuhn

3
1) Evet. 2) Şahsen değil, hayır. Puanlama kuralları, çalıştığım ML bitinde "moda" değildir. Scholar'da hızlıca dürtme , genel olarak biraz tarihlenmiş gibi görünüyor. Bu makale senin için ilginç olacak gibi görünüyor 3) Performans ile "öngörülü performans" değil, "hesaplamalı performans" demek istedim.
Andy Jones
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.