Gumbel-max hile kullanarak log alanı bırakmadan log olasılıkları verilen kategorik dağılımdan örnekleme yapmak mümkündür . Fikir, eğer normal olmayan günlük olasılıkları , softmax işlevi kullanılarak uygun olasılıklara çevrilebilirα1,…,αk
pi=exp(αi)∑jexp(αj)
bu tür bir dağıtımdan örnek almak için, , konumu ile parametrelenen standart Gumbel dağılımından alınan bağımsız örnekler ise ,g1,…,gk∼G(0)m
F(G≤g)=exp(−exp(−g+m))
sonra gösterilebilir (aşağıdaki referanslara bakın)
argmaxi{gi+αi}maxi{gi+αi}∼exp(αi)∑jexp(αj)∼G(log∑iexp{αi})
ve alabiliriz
z=argmaxi{gi+αi}
olasılıkları ile kategorize edilen kategorik dağılım parametrelerinden bir örnek olarak . Bu yaklaşım ile blog girişlerinde daha ayrıntılı olarak nitelendirildi Ryan Adams ve Laurent Dinh , dahası Chris J. Maddison, Daniel Tarlow ve Tom Minka bir speach verdi ( slaytlar üzerine) Sinir Bilgi İşleme Sistemleri konferansında (2014) başlıklı bir makale yazdı A * Bu fikirleri genelleştiren örnekleme (ayrıca bkz. Maddison, 2016; Maddison, Mnih ve Teh, 2016; Jang ve Poole, 2016), Yellott'a (1977) bu mülkü ilk tarif edenlerden biri olarak bahsetmektedir.p1,…,pk
O kullanarak uygulamak oldukça kolaydır örnekleme dönüşümü ters alarak nereye üzerinde düzgün dağılımdaki çizer vardır . Kesinlikle kategorik dağıtımdan örnekleme için en zaman tasarruflu algoritmalar değildir, ancak bazı senaryolarda bir avantaj olabilecek log-space'de kalmanıza izin verir.gi=−log(−logui)ui(0,1)
Maddison, CJ, Tarlow, D. ve Minka, T. (2014). A * örnekleme. [İç:] Sinir Bilgi İşleme Sistemlerindeki Gelişmeler (s. 3086-3094).
Yellott, JI (1977). Luce'ın seçim aksiyomu, Thurstone'un karşılaştırmalı yargı teorisi ve çifte üstel dağılım arasındaki ilişki. Matematiksel Psikoloji Dergisi, 15 (2), 109-144.
Maddison, CJ, Mnih, A. ve Teh, YW (2016). Beton Dağılımı: Ayrık Rasgele Değişkenlerin Sürekli Gevşemesi. arXiv ön baskı arXiv: 1611.00712.
Jang, E., Gu, S. ve Poole, B. (2016). Gumbel-Softmax ile Kategorik Yeniden Parametreleme. arXiv ön baskı arXiv: 1611.01144.
Maddison, CJ (2016). Monte Carlo için bir Poisson süreç modeli. arXiv ön baskı arXiv: 1602.05986.
exp
hassasiyet kaybedebilir ve [1.0, 3.45e-66, 0.0, 7.54e-121] gibi dağıtımlara yol açabilir. . Bu durumda bile sağlam bir cevap beklemek istiyorum. Ama şimdilik cevabınızı onaylıyorum.