Geçmişim ağırlıklı olarak makine öğrenimi ve Bayesci Hipotez testinin ne anlama geldiğini öğrenmeye çalışıyordum. Olasılığın bayes yorumuyla iyiyim ve olasılıklı grafik modeller bağlamında buna aşinayım. Ancak, beni şaşırtan şey, "Hipotez" kelimesinin istatistiksel çıkarım bağlamında ne anlama geldiği.
Ben genellikle makine öğrenimine alışkın olduğum kelime dağarcığıyla karşılaştırıldığında normalde istatistik ve çıkarımda kullanılanlara karşı kafam karışıyor.
Bağlamında denetlenen öğrenme , normalde kendi etiketlerine yani örnekler eşler öngörü fonksiyonu olarak hipotez düşünüyorum . Ancak bana öyle geliyor ki, yaptığım okumalarda hipotez terimi aynı anlama gelmiyor. Okuduğum okumaların bir özetini yapıştırmama izin verin:
Dikkatlice okursanız şunu da söyler:
gözlemlenen veriler için farklı bir model var ...
model kelimesini kullanıyorlardı. Benim için kelime modeli, belirli bir tahmin işlevi seçersek, bir dizi işlevi düşünmemi sağlıyor. yani bir hipotez sınıf fonksiyon. Örneğin, ikinci dereceden fonksiyonların hipotez sınıfı olabilir (derece 2 polinomu). Ancak bana öyle geliyor ki, bu alıntıda eş anlamlı olarak model ve hipotez kelimesini kullanıyorlar (benim için tamamen farklı kelimeler).
Daha sonra hipoteze öncelik verebileceğimizi söylemeye devam ediyoruz (bayesian bir ortamda yapılması tamamen mantıklı bir şey):
ayrıca mevcut bir hipotezle verileri karakterize edebiliriz:
ve bazı veriler (ve Baye kuralı) verildiğinde mevcut inancımızı güncelleyin:
Ancak, sanırım daha çok bir hipotez sınıfından tüm hipotez sınıfından ziyade belirli bir parametreye (say ) bayes kestirimi yapmaya alışkınım . Temel olarak, bu "hipotezler" alışkın olduğum makine öğrenimi bağlamından aynı hipotezler olmadığı için, bana göre bu hipotezler, hipotez sınıfından çok belirli bir parametresine daha benzerdir .
Bu noktada, "hipotez" in tahmin işlevindeki ile aynı anlama geldiğine ikna oldum ( örneğin, bir parametre tarafından parametreleştirilmiş ), ama sanırım yanılmışım ...
Karışıklık durumumu daha da kötüleştirmek için, daha sonra aynı okumalar gözlemledikleri her eğitim örneğine özel bir "hipotez" belirlemeye devam etti. Ne demek istediğimin bir özünü yapıştırmama izin verin:
bunun beni karıştırmasının sebebi, hipotezi bir parametre olarak yorumlarsam, o zaman benim için gördüğümüz her örnek değeri için belirli bir parametre belirtmenin hiçbir anlamı yoktur. Bu noktada hipotez ile ne anlama geldiğini gerçekten bilmediğim sonucuna vardım ve bu soruyu gönderdim.
Ancak, tam olarak pes etmedim , sıkist istatistiklerde hipotezin ne anlama geldiğini araştırdım ve aşağıdaki han akademisi videosunu buldum . Bu video aslında bana mantıklı bir çok yapar belki bir frequentist vardır (! :) . Bununla birlikte, bir grup veri alırlar (bazı "örnek kümesi" gibi) ve örnek kümesinin özelliklerine dayanarak, verilerle ilgili sıfır hipotezini kabul edip etmemeye karar verirler. Ancak, okuduğum Bayes bağlamında , gözlemlenen her veri [nokta] vektörü için, "Olabilirlik oranı testi" ile bir hipotezle "etiketledikleri" anlaşılıyor:
Her veri örneğine hipotez atama yöntemleri, denetimli bir öğrenme ortamı gibi gözüküyor bile, her bir eğitim setine bir etiket ekliyor olsaydık. Ancak, bu bağlamda yaptıklarını sanmıyorum. Onlar ne yapıyor? Her veri örneğine hipotez atamak ne anlama geliyor? Bir hipotezin anlamı nedir? Model kelimesi ne anlama geliyor?
Temel olarak, karışıklığımın bu uzun açıklamasından sonra, birisi bu bağlamda bayesci hipotez testinin ne anlama geldiğini biliyor mu?
Sorumu geliştirmek için herhangi bir açıklamaya veya herhangi bir şeye ihtiyacınız varsa veya sorunun mantıklı olması için size yardımcı olmaktan mutluluk duyarım :)
Bir cevap arayışımda istatistiksel hipotez testi ile ilgili bazı yararlı şeyler buldum:
Bir CS geçmişinden (benim gibi) gelirseniz, bu konuya iyi bir giriş sağlar:
Bilgisayar bilimcileri için istatistiksel hipotez testine iyi bir giriş nedir?
Bir noktada "varsayılan parametreler" hakkında sordum (ne demek istediğimi tanımlamalıydım. Standart bir terim olduğunu düşündüm ama öyle değil, bu yüzden burada ele alacağım) ve gerçekten ne demek istediğimi düşünüyorum sahip olduğunuz her hipotez için parametreleri belirtirsiniz. Örneğin, sıfır hipotezinizin ne olduğuna ve parametrelerine nasıl karar verirsiniz? Bununla ilgili bir soru var: