İken tahmini kendiliğinden bilinmeyen parametrelerin değerlerine (örneğin lojistik regresyon katsayılar veya destek vektör makineleri ayıran altdüzlem olarak), ile geliyor hedefleniyor istatistiksel çıkarsama girişimleri belirsizlik bir ölçü ve / veya bir olasılık ifadesi eklemek için parametrelerin değerleri (standart hatalar ve güven aralıkları). Eğer istatistikçinin varsaydığı model yaklaşık olarak doğru ise, yeni gelen verinin bu modele uymaya devam etmesi koşuluyla, belirsizlik beyanları bunlarda bazı gerçeklere sahip olabilir ve kullanımda ne sıklıkta hata yapacağınıza dair bir ölçü sağlayabilir. kararlarını almak için model.
Olasılık ifadelerinin kaynakları iki yönlüdür. Bazen, ölçtüğünüz şeyin altta yatan bir olasılık dağılımını varsayabilir ve bazı matematiksel cadılıklarla (Gauss dağılımının çok değişkenli entegrasyonu, vb.), Sonucun olasılık dağılımını elde edebilirsiniz (Gauss verisinin örnek ortalaması Gauss'tur. ). Bayesci istatistiklerinde konjugat öncelikleri bu büyücülük kategorisine girer. Diğer zamanlarda, kişi asimptotik (büyük örnek) sonuçlarına dayanmalı, yeterince büyük örneklemde işlerin belirli bir şekilde davranmaya mecbur olduğunu belirten sonuçlara dayanmak zorundadır (Merkezi Limit Teoremi: ortalama ile belirtilen verinin örnek ortalaması ve varyans , ortalama ve varyansı olan yaklaşık Gauss'tur.σ 2 u σ 2 / nμσ2μσ2/ n , orijinal verilerin dağıtım şeklinden bağımsız olarak).
Makine öğrenmenin buna en yakını, numune eğitim ve doğrulama bölümlerine bölündüğünde çapraz doğrulama olur; ikincisi etkili bir şekilde, "eğer yeni veriler eski veriler gibi görünüyorsa, ancak tamamen modelimin kurulumunda kullanıldı, sonra hata oranının gerçekçi bir ölçüsü böyle ve böyle ". İstatistiksel varsayımlar yaparak modelin özelliklerini çıkarmaya çalışmak yerine, yukarıdaki CLT gibi herhangi bir matematiksel sonucu içermek yerine, aynı modeli veri üzerinde çalıştırarak tamamen deneysel olarak türetilmiştir. Muhtemelen, bu daha dürüst, ancak daha az bilgi kullandığından ve bu nedenle daha büyük örneklem boyutları gerektiriyor. Ayrıca, sürecin değişmediğini dolaylı olarak varsaymaktadır,
"Postereri çıkarım" ifadesi anlam ifade etse de (Ben bir Bayesian değilim, kabul edilen terminolojinin ne olduğunu tam olarak söyleyemem), bu çıkarım aşamasında herhangi bir varsayımda bulunmanın pek bir katkısı olduğunu sanmıyorum. Tüm Bayesian varsayımları, önceki modelde (1) ve varsayılan modelde (2) olup, bir kez kurulduktan sonra, posterior otomatik olarak takip eder (en azından Bayes teoremi ile teoride; pratik adımlar karmaşık olabilir; Gambling Sipps ... pardon, Gibbs örneklemesi bu posterior'a ulaşmanın nispeten kolay bir parçası olabilir). "Postereri çıkarmak" (1) + (2) anlamına gelirse, bu benim için istatistiksel bir çıkarımın tadıdır. (1) ve (2) ayrı ayrı belirtilirse ve "posterior çıkarımı" başka bir şey ise, o zaman yapmam.