Her turdan sonra yıpranma ile 5 turdan fazla kazanan ve kaybeden bahisler hakkında verilerim var. Verileri görüntülemek için aşağıdaki gibi bir karar ağacı kullanıyorum.
Ağacın tepesine doğru düğümler kazanan bahislere sahip olanlardır ve ağacın dibine doğru olan düğümler kaybetme bahislerine sahiptir. Her düğümdeki (b) ortalama bahis boyutlarındaki değişikliklerin (a) yıpranmasına bakmak istiyorum. Önceki düğümden her düğümde yıpranma oranına ve hayatta kalma oranına bakıyorum (olasılık% 50 ise her düğümde beklenen miktarda insan kullanarak). Örneğin, başlayan her 1000 düğümde olasılık% 50 ise, ikinci düğüm W ve L'nin her birinde yaklaşık 500 kişi olmalıdır. Hipotez (a) yıpranma oranı kaybettikten sonra daha yüksektir bahisler (b) ortalama bahis büyüklüğü kaybedenler sonra azalır ve kazananlar sonra artar.
Bunu önce çok basit bir tek değişkenli ortamda yapmak istiyorum. 50 kişinin bırakması durumunda WW düğümünden WWW düğümündeki ortalama bahis boyutundaki değişikliği göstermek için nasıl bir t testi yapabilirim? Bunun doğru yaklaşım olduğundan emin değilim: sonraki her bahis bağımsızdır, ancak insanlar kaybedenlerden sonra oyundan atılırlar, bu yüzden örnek eşleşmez. Eğer aynı sınıfın, hiç kimseyi bırakmadan birbiri ardına bir dizi sınava girmesi olsaydı, uygun t-testinin nasıl yapılacağını anlardım, ama bence bu biraz farklı.
Bunu nasıl yapabilirim? Ayrıca, sonuçlar az sayıda müşteri tarafından çarpıtılmışsa, ilk% 5 ve alt% 5'i nasıl çıkarabilirim? 1 - 3 bahis miktarından en yüksek kümülatif bahis büyüklüğüne sahip müşterileri çıkarmanız yeterli mi?
Ben şekil oluşturulan veri var, bu yüzden her düğüm ortalama, std, std hatası vb var.