Lütfen istatistik lingo benim kasap özür dilerim :) Burada reklam ve tıklama oranları ile ilgili birkaç soru bulduk. Fakat hiçbiri hiyerarşik durumumu anlamamda bana çok yardımcı olmadı.
İlgili bir soru var Bu hiyerarşik Bayesci modelin eşdeğer gösterimleri var mı? , ama aslında benzer bir problemleri olup olmadığından emin değilim. Başka bir soru Hiyerarşik Bayesian binom modeli için öncelikler hiperpriorlar hakkında ayrıntılara giriyor, ancak çözümlerini sorunuma eşleyemiyorum
Yeni bir ürün için çevrimiçi olarak birkaç reklamım var. Reklamların birkaç gün yayınlanmasına izin verdim. Bu noktada, hangisinin en fazla tıklama aldığını görmek için reklamları tıklayan yeterli sayıda kullanıcı var. En fazla tıklamaya sahip olanlar hariç hepsini tekmeledikten sonra, reklamı tıkladıktan sonra gerçekte ne kadar insan satın aldığını görmek için bir kaç gün daha yayınlanmasına izin verdim. Bu noktada, reklamları ilk etapta yayınlamanın iyi bir fikir olup olmadığını biliyorum.
Her gün sadece birkaç ürün sattığım için istatistiklerim çok gürültülü. Bu nedenle, bir reklamı gördükten sonra kaç kişinin bir şey satın aldığını tahmin etmek gerçekten zor. Her 150 tıklamadan yalnızca biri satın alma işlemiyle sonuçlanır.
Genel olarak konuşursak , reklam başına grup istatistiklerini tüm reklamlar üzerinde küresel istatistiklerle bir şekilde düzelterek her reklamda mümkün olan en kısa sürede para kaybedip kaybetmediğimi bilmem gerekir .
- Her reklam yeterince alım görene kadar beklersem çok uzun sürdüğü için kırılırım: 10 reklamı test etmek Her reklamın istatistiklerinin yeterince güvenilir olması için 10 kat daha fazla para harcamam gerekir. O zaman para kaybedebilirdim.
- Tüm reklamlar üzerinden satın alma işlemlerini ortalama yaparsam, aynı zamanda çalışmayan reklamları da alamazsınız.
Global satın alma oranını ( N $ alt dağıtımları miyim? Bu, her bir reklam için ne kadar fazla veriye sahip olduğum anlamına gelirse, o reklamın istatistikleri o kadar bağımsız olur. Henüz kimse bir reklamı tıklamamışsa, küresel ortalamanın uygun olduğunu varsayıyorum.
Bunun için hangi dağılımı seçerdim?
A'ya 20, B'ye 4 tıklama aldıysam bunu nasıl modelleyebilirim? Şimdiye kadar bir binom veya Poisson dağılımının burada mantıklı olabileceğini anladım:
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(satın alma oranını yalnızca A grubu için mi tahmin edersiniz?)
Ama aslında aslında hesaplamak için ne yapacağım purchase_rate | group A
. A grubuna (veya başka bir gruba) anlam vermek için iki dağılımı nasıl birleştiririm?
Önce bir modele uymam gerekir mi? Bir modeli "eğitmek" için kullanabileceğim verilerim var:
- İlan A: 352 tıklama, 5 alımlar
- Reklam B: 15 tıklama, 0 satın alma
- İlan C: 3519 tıklama, 130 alımlar
Gruplardan herhangi birinin olasılığını tahmin etmenin bir yolunu arıyorum. Bir grubun sadece birkaç veri noktası varsa, temel olarak küresel ortalamaya geri dönmek istiyorum. Bayesian istatistikleri hakkında biraz bilgi sahibi oldum ve Bayesian çıkarımını ve eşlenik öncelikleri ve benzerlerini kullanarak nasıl modellediklerini açıklayan birçok PDF'yi okudum. Bunu doğru bir şekilde yapmanın bir yolu olduğunu düşünüyorum, ancak doğru bir şekilde nasıl modelleneceğini anlayamıyorum.
Sorunumu Bayesci bir şekilde formüle etmeme yardımcı olacak ipuçlarından çok mutlu olurum. Bu, aslında bunu uygulamak için kullanabileceğim çevrimiçi örnekler bulmakta çok yardımcı olacaktır.
Güncelleme:
Yanıt verdiğiniz için çok teşekkürler. Sorunum hakkında gittikçe daha küçük parçaları anlamaya başlıyorum. Teşekkür ederim! Sorunu şimdi biraz daha iyi anlayıp anlamadığımı görmek için birkaç soru sorayım:
Bu yüzden dönüşümlerin Beta dağıtımları olarak dağıtıldığını ve bir Beta dağıtımının ve olmak üzere iki parametresi olduğunu varsayıyorum .b
onlar önce parametrelerdir böylece parametreler hyperparameters nelerdir? Sonunda, dönüşüm sayısını ve tıklama sayısını Beta dağıtımımın parametresi olarak ayarladım? 1
Bir noktada farklı reklamları karşılaştırmak istediğimde . Bu formülün her bir parçasını nasıl hesaplayabilirim?
Bence , Beta dağıtımının olasılığı veya "modu" olarak adlandırılıyor. Bu , ve dağıtımımın parametreleri. Ancak buradaki belirli ve , yalnızca reklamı için dağıtım parametreleri , değil mi? Bu durumda, yalnızca bu reklamın gördüğü tıklama ve dönüşüm sayısı mıdır? Yoksa tüm reklamların kaç tıklama / dönüşüm gördüğü?α - 1 αβαβX
Sonra bilgilendirici olmayan, benim durumumda sadece Jeffreys olan P (dönüşüm) olan önceki ile çarpıyorum. Önceden daha fazla veri aldığım gibi kalacak mı?
Ben bölün , ne sıklıkta bu reklam tıklandığında sayılmaz böylece marjinal olabilirlik, hangi?
Jeffreys'i daha önce kullanırken sıfırdan başladığımı ve verilerim hakkında hiçbir şey bilmediğimi varsayıyorum. Bu önceliğe "bilgilendirici olmayan" denir. Verilerimi öğrenmeye devam ederken, öncekini güncelleyebilir miyim?
Tıklamalar ve dönüşümler geldikçe dağıtımımı "güncellemem" gerektiğini okudum. Bu, dağıtımımın parametrelerinin değiştiği veya önceki değişikliklerin değiştiği anlamına mı geliyor? X reklamı için bir tıklama aldığımda, birden fazla dağıtımı güncelleyebilir miyim? Birden fazla mı?