Hiyerarşik Bayesian Modeli (?)


12

Lütfen istatistik lingo benim kasap özür dilerim :) Burada reklam ve tıklama oranları ile ilgili birkaç soru bulduk. Fakat hiçbiri hiyerarşik durumumu anlamamda bana çok yardımcı olmadı.

İlgili bir soru var Bu hiyerarşik Bayesci modelin eşdeğer gösterimleri var mı? , ama aslında benzer bir problemleri olup olmadığından emin değilim. Başka bir soru Hiyerarşik Bayesian binom modeli için öncelikler hiperpriorlar hakkında ayrıntılara giriyor, ancak çözümlerini sorunuma eşleyemiyorum

Yeni bir ürün için çevrimiçi olarak birkaç reklamım var. Reklamların birkaç gün yayınlanmasına izin verdim. Bu noktada, hangisinin en fazla tıklama aldığını görmek için reklamları tıklayan yeterli sayıda kullanıcı var. En fazla tıklamaya sahip olanlar hariç hepsini tekmeledikten sonra, reklamı tıkladıktan sonra gerçekte ne kadar insan satın aldığını görmek için bir kaç gün daha yayınlanmasına izin verdim. Bu noktada, reklamları ilk etapta yayınlamanın iyi bir fikir olup olmadığını biliyorum.

Her gün sadece birkaç ürün sattığım için istatistiklerim çok gürültülü. Bu nedenle, bir reklamı gördükten sonra kaç kişinin bir şey satın aldığını tahmin etmek gerçekten zor. Her 150 tıklamadan yalnızca biri satın alma işlemiyle sonuçlanır.

Genel olarak konuşursak , reklam başına grup istatistiklerini tüm reklamlar üzerinde küresel istatistiklerle bir şekilde düzelterek her reklamda mümkün olan en kısa sürede para kaybedip kaybetmediğimi bilmem gerekir .

  • Her reklam yeterince alım görene kadar beklersem çok uzun sürdüğü için kırılırım: 10 reklamı test etmek Her reklamın istatistiklerinin yeterince güvenilir olması için 10 kat daha fazla para harcamam gerekir. O zaman para kaybedebilirdim.
  • Tüm reklamlar üzerinden satın alma işlemlerini ortalama yaparsam, aynı zamanda çalışmayan reklamları da alamazsınız.

Global satın alma oranını ( N $ alt dağıtımları miyim? Bu, her bir reklam için ne kadar fazla veriye sahip olduğum anlamına gelirse, o reklamın istatistikleri o kadar bağımsız olur. Henüz kimse bir reklamı tıklamamışsa, küresel ortalamanın uygun olduğunu varsayıyorum.perclick)anduseitasapriorfor

Bunun için hangi dağılımı seçerdim?

A'ya 20, B'ye 4 tıklama aldıysam bunu nasıl modelleyebilirim? Şimdiye kadar bir binom veya Poisson dağılımının burada mantıklı olabileceğini anladım:

  • purchase_rate ~ poisson (?)
  • (purchase_rate | group A) ~ poisson (satın alma oranını yalnızca A grubu için mi tahmin edersiniz?)

Ama aslında aslında hesaplamak için ne yapacağım purchase_rate | group A. A grubuna (veya başka bir gruba) anlam vermek için iki dağılımı nasıl birleştiririm?

Önce bir modele uymam gerekir mi? Bir modeli "eğitmek" için kullanabileceğim verilerim var:

  • İlan A: 352 tıklama, 5 alımlar
  • Reklam B: 15 tıklama, 0 satın alma
  • İlan C: 3519 tıklama, 130 alımlar

Gruplardan herhangi birinin olasılığını tahmin etmenin bir yolunu arıyorum. Bir grubun sadece birkaç veri noktası varsa, temel olarak küresel ortalamaya geri dönmek istiyorum. Bayesian istatistikleri hakkında biraz bilgi sahibi oldum ve Bayesian çıkarımını ve eşlenik öncelikleri ve benzerlerini kullanarak nasıl modellediklerini açıklayan birçok PDF'yi okudum. Bunu doğru bir şekilde yapmanın bir yolu olduğunu düşünüyorum, ancak doğru bir şekilde nasıl modelleneceğini anlayamıyorum.

Sorunumu Bayesci bir şekilde formüle etmeme yardımcı olacak ipuçlarından çok mutlu olurum. Bu, aslında bunu uygulamak için kullanabileceğim çevrimiçi örnekler bulmakta çok yardımcı olacaktır.

Güncelleme:

Yanıt verdiğiniz için çok teşekkürler. Sorunum hakkında gittikçe daha küçük parçaları anlamaya başlıyorum. Teşekkür ederim! Sorunu şimdi biraz daha iyi anlayıp anlamadığımı görmek için birkaç soru sorayım:

Bu yüzden dönüşümlerin Beta dağıtımları olarak dağıtıldığını ve bir Beta dağıtımının ve olmak üzere iki parametresi olduğunu varsayıyorum .bab

onlar önce parametrelerdir böylece parametreler hyperparameters nelerdir? Sonunda, dönüşüm sayısını ve tıklama sayısını Beta dağıtımımın parametresi olarak ayarladım? 112 12

Bir noktada farklı reklamları karşılaştırmak istediğimde . Bu formülün her bir parçasını nasıl hesaplayabilirim?P(conversion|ad=X)=P(ad=X|conversion)P(conversion)P(ad=X)

  • Bence , Beta dağıtımının olasılığı veya "modu" olarak adlandırılıyor. Bu , ve dağıtımımın parametreleri. Ancak buradaki belirli ve , yalnızca reklamı için dağıtım parametreleri , değil mi? Bu durumda, yalnızca bu reklamın gördüğü tıklama ve dönüşüm sayısı mıdır? Yoksa tüm reklamların kaç tıklama / dönüşüm gördüğü?α - 1P(ad=X|conversion) αβαβXα1α+β2αβαβX

  • Sonra bilgilendirici olmayan, benim durumumda sadece Jeffreys olan P (dönüşüm) olan önceki ile çarpıyorum. Önceden daha fazla veri aldığım gibi kalacak mı?

  • Ben bölün , ne sıklıkta bu reklam tıklandığında sayılmaz böylece marjinal olabilirlik, hangi?P(ad)

Jeffreys'i daha önce kullanırken sıfırdan başladığımı ve verilerim hakkında hiçbir şey bilmediğimi varsayıyorum. Bu önceliğe "bilgilendirici olmayan" denir. Verilerimi öğrenmeye devam ederken, öncekini güncelleyebilir miyim?

Tıklamalar ve dönüşümler geldikçe dağıtımımı "güncellemem" gerektiğini okudum. Bu, dağıtımımın parametrelerinin değiştiği veya önceki değişikliklerin değiştiği anlamına mı geliyor? X reklamı için bir tıklama aldığımda, birden fazla dağıtımı güncelleyebilir miyim? Birden fazla mı?

Yanıtlar:


9

Sezgisel olarak sorunuzu ele almanın çok genel bir yolu, hiyerarşik (çok düzeyli) bir Bayes modeli oluşturmaktır. Modelin aşağıda gösterildiği gibi üç bölümü vardır.

model

Reklam dönüşüm oranları için hiyerarşik Bayesian modeli

  1. Nüfus düzeyinde, test edilen belirli reklam kümenizin örneklendiği reklam popülasyonundaki dönüşüm olasılığını modelliyoruz. Nüfus parametrelerini düzeltebilir ve daha önce Neil tarafından belirtildiği gibi bunları ikinci seviye için bir öncü olarak kullanabilirsiniz. Alternatif olarak, nüfus parametrelerinin kendilerine bir öncelik verebiliriz, bu da artık veriler ışığında nüfus parametreleri hakkındaki belirsizliğimizi ifade edebileceğimiz ek avantaj sağlar. En bu yolu takip edelim ve bir önceki koyun nüfus ortalama üzerinde ve nüfus hassasiyet üzerinde ( yani ters varyans). Yaygın bir öncekiN(μμ0,η0)μGa(λa0,b0)μ0=0,η0=0.1,a0=1,b0=1Bu, posterior çıkarımlarımızın verilere hakim olmasını sağlar.

  2. Bireysel reklamların düzeyinde, dönüşüm olasılığı modelleyebilirsiniz belirli bir reklam ait logit-normal dağılıma sahip olarak. Bu nedenle, her reklam , logit dönüşüm olasılığı olarak modellenmiştir .πjjjρj:=logit(πj)N(ρjμ,λ)

  3. Son olarak, gözlemlenen veri seviyesinde, dönüşüm sayısını modeli reklam için olarak burada, dönüşümü sigmoid kullanır bir olasılık haline logit oranı geri çevirmek ve nereye reklam tıklanma sayısıdır . j Bin ( k jσ ( ρ j ) , n j ) σ ( ρ j ) n j jkjjBin(kjσ(ρj),nj)σ(ρj)njj

Veri

Örnek olarak, orijinal sorunuza gönderdiğiniz verileri ele alalım,

İlan A: 352 tıklama, 5 alımlar

Reklam B: 15 tıklama, 0 satın alma

İlan C: 3519 tıklama, 130 alımlar

çevirdiğimiz :n1=352,k1=5,n2=15,k2=0,

sonuç

Bu modeli tersine çevirmek, model parametrelerimiz için posterior dağılımlar elde etmek anlamına gelir. Burada, model tersine çevirmek için MCMC gibi stokastik örnekleme planlarından daha verimli olan varyasyonel bir Bayes yaklaşımı kullandım. Aşağıdaki sonuçları planladım.

Veriler ve ortaya çıkan posteriorlar

Şekilde üç panel gösterilmektedir. (a) Verdiğiniz örnek verilerin basit bir şekilde görselleştirilmesi. Gri çubuklar tıklama sayısını, siyah çubuklar dönüşüm sayısını gösterir. (b) Nüfus ortalama dönüşüm oranı üzerinde ortaya çıkan posterior dağılım. Daha fazla veri gözlemlediğimizde, bu daha kesin hale gelecektir. (c) Reklama özel posterior dönüşüm oranlarının merkezi% 95 posterior olasılık aralıkları (veya güvenilir aralıkları).

Son panel, hiyerarşik modellemeye Bayesci bir yaklaşımın iki temel özelliğini göstermektedir. İlk olarak, posteriorların hassasiyeti, temeldeki veri noktalarının sayısını yansıtır. Örneğin, reklam C için nispeten fazla veri noktamız var; böylece, onun arka kısmı diğer reklamların arka kısımlarından çok daha kesindir.

İkincisi, reklama özgü çıkarımlar nüfus hakkında bilgi ile bildirilir. Başka bir deyişle, reklama özgü posteriorlar , popülasyona daralma olarak bilinen bir etki olan tüm gruptaki verilere dayanmaktadır . Örneğin, A reklamının arka modu (siyah daire), ampirik dönüşüm oranından (mavi) çok daha yüksektir. Bunun nedeni, diğer tüm reklamların daha yüksek arka modlara sahip olmasıdır ve bu nedenle, reklama özgü tahminlerimizi grup ortalamasına bildirerek temel gerçeği daha iyi tahmin edebiliriz. Belirli bir reklam hakkında ne kadar az veriye sahip olursak, reklamın arka yüzü diğer reklamlardan gelen verilerden o kadar fazla etkilenir.

Orijinal sorunuzda tarif ettiğiniz tüm fikirler, tamamen Bayesci bir ortamın pratik faydasını gösteren yukarıdaki modelde doğal olarak gerçekleştirilir.


Kay, detaylı cevabınız için teşekkür ederim. Cevabın biraz tarihli olduğunu anlıyorum ama sakladıysanız eşlik eden kodu paylaşmayı düşünür müsünüz? Hiyerarşik Bayesci Modellemeyi öğrenmeye çalışıyorum ama R'de sezgisel örnekler bulmak için mücadele
ediyorum

@Kay, ilginç cevap için teşekkürler, hiyerarşik Bayesian modellerine biraz referans verebilir misiniz? Teşekkürler!
user511005

1
: Merhaba @Zhubarb, user511005, burada yukarıdaki modelini tarif kağıda bir bağlantı sciencedirect.com/science/article/pii/S1053811913002371 ben ettik burada bir araya varyasyon çıkarsama kısa bir giriş koyun: people.inf.ethz.ch/ bkay / görüşmeler / Brodersen_2013_03_22.pdf
Kay Brodersen

2

p

paabb

ab(12,12)a,b

pa,b


Yaptığınız düzenlemelere yanıt olarak:

pabppab

Bayesian güncellemesi

P(px)P(p)P(xp)

xpababp

Jeffreys'in önceliği, bilgisiz olanla aynı şey değildir, ancak kullanmak için iyi bir nedeniniz olmadıkça daha iyi olduğuna inanıyorum. Bununla ilgili bir tartışma başlatmak istiyorsanız, başka bir soru sormaktan çekinmeyin.


Yanıt verdiğiniz için teşekkürler! Orijinal yorumumu güncelledim çünkü bu yorum kutusundaki karakterler bitti. Güncellemede yazdığım bazı ayrıntılar için geri bildirimde bulunmanız harika olurdu.
Mika Tiihonen
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.