Yıllar önce istatistik okudum ve hepsini unuttum, bu yüzden bunlar belirli bir şeyden daha genel kavramsal sorular gibi görünebilir ama işte benim sorunum.
Bir e-ticaret web sitesinde UX Tasarımcısı olarak çalışıyorum. Yıllar önce inşa edilen ve bundan şüphe etmeye başladığım bir A / B test çerçevemiz var.
Tüm kararlarımızı verdiğimiz metrik dönüşüm olarak bilinir ve siteyi ziyaret eden, bir şey satın alan kullanıcıların yüzdesine dayanır.
Bu yüzden Satın Al düğmesinin rengini Yeşil'den Maviye değiştirmeyi test etmek istiyoruz.
Kontrol zaten sahip olduğumuz şeydir, ortalama dönüşüm oranımızın ne olduğunu bildiğimiz Yeşil düğme. Deney, Yeşil düğmeyi Mavi düğmeyle değiştiriyor.
% 95 öneminin, mutlu olduğumuz güven seviyesi olduğuna katılıyoruz ve denemeyi açıyoruz, çalışır durumda bırakıyoruz.
Kullanıcılar siteyi ziyaret ettiğinde, sahne arkasında 50/50 şansı vardır ve deneme sürümüne (mavi düğme) kontrol sürümüne gönderilirler (yeşil düğme).
7 gün sonra deneye baktıktan sonra 3000 örnek (1500 kontrole, 1500 deneye) ve% 99.2 istatistiksel anlamlılığa sahip deney lehine dönüşümde% 10.2'lik bir artış görüyorum. Mükemmel bence.
Deney devam ediyor, numune boyutu büyüyor ve daha sonra dönüşümde% 98.1'lik bir önem ile% + 9 artış görüyorum. Tamam, denemenin daha uzun süre çalışmasını sağlayın ve şimdi deney sadece% 92'lik istatistiksel bir öneme sahip dönüşümde sadece% 5'lik bir artış gösteriyor, çerçeve bana% 95 öneme ulaşmadan önce 4600 daha fazla örneğe ihtiyacım olduğunu söylüyor?
Deney hangi noktada kesin?
Örnek boyutu üzerinde önceden anlaştığınız ve denemeyi tamamladığınız bir klinik deneme süreci olduğunu düşünürsem, metriğin% 99'luk önemi olan% 10'luk bir iyileşme görüyorsanız, o ilacın piyasaya sürülmesine karar verilir. Ancak daha sonra deneyi 4000 kişi üzerinde yapmışlarsa ve metrikte% 5'lik bir iyileşme görüyorlarsa, bu ilacın pazara girmesine izin verilmeyecekti.
Önceden bir örneklem büyüklüğü üzerinde anlaşmalı mıyız ve bu örneklem büyüklüğüne ulaşıldığında durmalı ve deneyi kapatma noktasında önem% 99 ise sonuçlardan memnun kalmalı mıyız?