Günlük-olasılık dağılımı nedir?


11

Makine öğrenimi üzerine bir ders kitabı okuyorum (Data Mining by Witten ve diğerleri, 2011) ve bu pasajla karşılaştım:

... Ayrıca, farklı dağıtımlar kullanılabilir. Normal dağılım genellikle sayısal özellikler için iyi bir seçim olsa da, önceden belirlenmiş bir minimum değere sahip ancak üst sınırı olmayan özellikler için uygun değildir; bu durumda bir "log-normal" dağılımı daha uygundur. Yukarıda ve aşağıda sınırlanan sayısal özellikler bir "log-odds" dağılımı ile modellenebilir .

Bu dağılımı hiç duymadım. "Log-odds dağılımı" için googledim, ancak alakalı tam bir eşleşme bulamadım. Birisi bana yardım edebilir mi? Bu dağılım nedir ve neden yukarıda ve aşağıda sınırlı sayılara yardımcı olur?

PS: Ben istatistikçi değil, yazılım mühendisiyim.

Yanıtlar:


14

neden yukarıda ve aşağıda sınırlı sayılara yardımcı olur?

(0,1)(0,1)(0,1)(a,b)

bu dağılım nedir ...?

'Log-odds dağılımı' terimi maalesef tamamen standart değildir (ve o zaman bile çok yaygın bir terim değildir).

Bunun ne anlama gelebileceği konusunda bazı olasılıkları tartışacağım. Birim aralığında değerler için dağılımlar oluşturmanın bir yolunu düşünerek başlayalım.

P(0,1)[0,1]P=X/nX

F1(0,1)GF,G

Y=log(P1P)Y

(μ,τ)Y(0,1)P=exp(Y)1+exp(Y)Pμ,τ

resim açıklamasını buraya girin

Vd Witten tarafından metinde kısa söz baktığımızda, bu olabilir ama onlar başka şekilde kolayca ortalama şey olabilir - "log oran dağılımı" ile amaçlanan ne olacak.

Başka bir olasılık, logit-normalin amaçlanmış olmasıdır.

[1]FG(0,1)), bu da çok çaba harcadıkları görülüyor. (Uygunsuz modelden kaçınmak daha kolay görünebilir, ancak belki de sadece ben.)

YP

PY

[2]

Gördüğünüz gibi, bu tek bir anlamı olan bir terim değil. Witten veya bu kitabın diğer yazarlarından birinden daha net bir gösterge olmadan, neyin amaçlandığını tahmin etmeye bırakıldık.

[1]: Noel van Erp ve Pieter van Gelder, (2008),
"Bir Arıza Durumunda Beta Dağılımının Yorumlanması"
6. Uluslararası Olasılıklar Çalıştayı Bildirileri , Darmstadt
pdf link

[2]: Yan Guo, (2009),
NDE Sistemleri Kapsül Kabiliyeti Değerlendirmesi ve Sağlamlığı Üzerine Yeni Yöntemler, Drone
, Detroit, Wayne Eyalet Üniversitesi Enstitüsü'ne sunulan Tez


1
(+1) Kitabın tamamının arandığı hiçbir açıklama yapılmadığını gösterir. Bağlam, "log-odds dağılımı" nın, önceki cümlede "lognormal" ifadesinin tüm negatif olmayan değerler (!) İçin evrensel bir dağıtım olarak önerildiği gibi, belirli bir modele atıfta bulunduğunu göstermektedir.
whuber

1
@whuber Kitapta ne olduğu konusundaki karakterizasyonunuza katılıyorum - Terimin diğer bağlamlarda kullanımı ile ilgili yorumlarımın örnek dağılımına atıfta bulunmak istemediğimi düşünmedim, ancak bu sadece kitaptaki niyetin bunun birkaç anlamı olan bir terim olduğunun bir göstergesi. Söz konusu pasajlarda, bu materyali öğrenen insanlara tavsiyem (birçok şeyde olduğu gibi) birden fazla kitap okumak olacaktır.
Glen_b

2

Yazılım mühendisiyim (istatistikçi değilim) ve son zamanlarda İstatistiksel Öğrenmeye Giriş adlı bir kitap okudum. R'deki uygulamalar ile.

Sanırım hakkında okuduğunuz şey log-odds ya da logit. sayfa 132

http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf

Parlak kitap - onu baştan sona okudum. Bu yardımcı olur umarım


İşaretçi için teşekkürler. Log-odds dağıtımının "lojistik dağıtım" ile aynı olduğunu varsayarsak, ikincisi Wikipedia'da aradım. PDF'sinin alt veya üst sınırı yok gibi görünüyor. Bu yüzden, başlangıçta alıntıladığım ders kitabının neden bu dağılımla "yukarıda ve aşağıda sınırlandırılmış sayısal nitelikler modellenebildiğini" söylediğini merak ediyorum.
stackoverflowuser2010

Bence sınırların 0.0 (imkansız) ila 1.0 (kesin) olduğu fonksiyonun çıktısı hakkında konuşuyor. (Burada tamamen yanlış olabilirim)
JasonEdinburgh

Modelinizin keyfi olarak büyük pozitif veya negatif sonuçlar vermesi mümkündür. Bunlar olasılık gibi sınırlı bir aralık olarak yorumlanamayabilir, ancak logit fonksiyonu ve bunun tersi lojistik fonksiyonu kullanılarak log-odds olarak yorumlanabilir.
Henry
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.