Önceki araştırmacılar, sadece istatistiksel bir yanlışlık nedeniyle sıcak eli tespit edemediler mi?


11

Birçok basketbol taraftarı / oyuncusu art arda birkaç atış yaptıktan sonra bir sonraki atışın daha muhtemel olduğunu düşünüyor. Buna bazen sıcak el deniyor.

Gilovich, Mallone ve Tversky (1985 ) ile başlayarak (bence) bunun aslında bir yanlışlık olduğu "gösterildi". Arka arkaya birkaç çekim yapılmış olsa bile, bir sonraki çekimin ortalama çekim yüzdesinin dikte edeceğinden daha fazla gitme olasılığı yoktur.

Miller ve Sanjurjo (2015) , sıcak elin gerçekten var olduğunu ve önceki araştırmacıların oldukça basit bir istatistiksel yanlışlığa avlandığını iddia ediyorlar. Argümanları şöyle:

Dört kez bozuk para çevirin. H'nin H'yi takip etme olasılığını hesaplayın. Birkaç örnek vermek gerekirse: HHTT'nin olasılığı 1/2, HTHT'nin olasılığı 0/2, TTHH olasılığı 0/1 1/1 olurdu ve hem TTTT hem de TTTH NA olacaktır

Miller ve Sanjurjo'nun yumruk çizgisi, bu olasılığın beklenen değerinin 0,5 değil ≈0,4 olmasıdır. Önceki araştırmacılar tarafından yapılan hata, bu olasılığın beklenen değerinin 0,5 olduğunu yanlış bir şekilde varsaymaktı. Örneğin, bu önceki araştırmacılar yukarıdaki jeton çevirme deneyini gerçekleştirdiler ve ortalama 0.497 demek için olasılık bulduklarında, yanlış bir sıcak elin (0.5'ten önemli ölçüde farklı değil) hiçbir kanıt olmadığı sonucuna vardılar. sıcak elin güçlü kanıtı (0.4'ten önemli ölçüde farklı).

Benim sorum şudur: Miller ve Sanjurjo, önceki araştırmacıların sadece bu hata nedeniyle sıcak eli tespit edemedikleri konusunda doğru mu? Bu konuda sadece bir ya da iki makale gözden geçirdim, bu yüzden bu literatürü daha iyi bilen birinden onay almak istedim. Bu, otuz yıl veya daha fazla süredir devam etmek şaşırtıcı derecede aptalca bir hata gibi görünüyor.


3
Bu , özellikle dışarıdakiler için değerlendirilmesi oldukça zor olduğu için bu site için tehlikeli bir sorudur . Ve bu şekilde oy çokluğu ile en iyi cevapları "belirleriz". Tüm yanıtları okuduğunuzdan emin olun ve yalnızca hepsini okuduktan sonra doğru görünenleri oylayın ve sizi tatminsiz / şüpheli bırakanları aşağıya oylayın.
FooBar

1
Bunun nedeni, doğru yanıtın sezgisel olabilmesidir. Böyle bir site 60 yıl önce mevcut olsaydı, benzer özelliklere sahip olan Monty Hall sorununa doğru cevabın çoğunluk oyu ile zirveye çıkacağını düşünmüyorum.
FooBar

@FooBar, konuya eklemek için, burada bir anda devam eden iki karmaşık soru var: (1) "Miller ve Sanjuro'nun tartıştığı matematiksel etki nedir" --- bu Kenny LJ'nin sorduğu soru değil, iyi soru çünkü anlamak için çok fazla okuma gerekiyor ve nispeten objektif. Sonra (2) öznel ve görüş tabanlı görünüyor "Bu önceki araştırma geçersiz kılıyor" olduğunu ....
usul

@usul: Ekonomide bazı durumlarda ikinci soru ("Bu önceki araştırmaları geçersiz kılıyor mu?") gerçekten daha tartışmalı ve fikir tabanlıdır - örneğin Reinhart ve Rogoff (2010) makalesi üzerindeki tartışma. Ama bence bu durumda açıkça tanımlanmış bir matematik problemimiz var. Ve aşağıdaki cevabımda göstermeye çalıştığım (netlik ve kısalık için bir kez daha yeniden yazdım), Miller ve Sanjurjo (2015) gerçekten de Gilovich, Mallone ve Tversky'nin (1985) sonuçlarını geçersiz kılmayı başardılar.
Kenny LJ

@KennyLJ, 1985 belgesindeki kanıtlardan birinin geçersiz olduğunu gösterdiler. Bu, sonucun geçersiz olduğunu göstermekten çok farklı bir sorudur, örneğin bir sıcak el etkisinin kesinlikle var olduğunu göstermek.
usul

Yanıtlar:


6

(Bu yanıt, Temmuz 2017'de daha fazla netlik ve okunabilirlik için tamamen yeniden yazılmıştır.)

Arka arkaya 100 kez bozuk para çevirin.

Üç kuyruk çizgisinden hemen sonra kapağı inceleyin. Let p ( H | 3 T ) para oranı kafaları arka arkaya üç kuyrukları her çizgi sonra döndürür olabilir. Benzer şekilde, izin p ( H | 3 H ), para oranı kafaları arka arkaya üç kafaların her çizgi sonra döndürür olabilir. ( Bu cevabın altındaki örnek. )p^(H|3T)p^(H|3H)

Let .x:=p^(H|3H)p^(H|3T)

Madeni para çevirmeler iid ise, o zaman 100 madeni para çevirmenin birçok dizisinde "açıkça",

(1) kadar sık ​​olması bekleniyor .x < 0x>0x<0

(2) .E(X)=0

Bir milyon 100 dolarlık para dizisi üretip aşağıdaki iki sonucu elde ediyoruz:

(I) kabaca kadar sık ​​görülür .x < 0x>0x<0

(II) ( milyon dizi arasındaki ortalamasıdır ). ˉ x xx¯0x¯x

Ve böylece jetonların gerçekten de olduğu sonucuna varıyoruz ve bir sıcak el kanıtı yok. Bu GVT'nin (1985) yaptığı şeydi (ancak madeni paralar yerine basketbol çekimleri ile). Ve bu, sıcak elin var olmadığı sonucuna vardı.


Punchline: Şok edici bir şekilde, (1) ve (2) yanlış. Bozuk paralar iid ise, bunun yerine

(1-düzeltildi) zamanın sadece yaklaşık% 37'sini oluştururken, zamanın yaklaşık% 60'ını meydana getirir. (Zamanın kalan% 3'ünde, ya ya da tanımsızdır - 100 döndürmede 3H çizgi olmadığından ya da 3T çizgi olmadığından.)x < 0 x = 0 xx>0x<0x=0x

(2 düzeltilmiş) .E(X)0.08

İlgili sezgi (veya karşı-sezgi) diğer birçok ünlü olasılık bulmacasına benzer: Monty Hall problemi, iki erkek problemi ve kısıtlı seçim ilkesi (kart oyunu köprüsünde). Bu cevap zaten yeterince uzun ve bu yüzden bu sezginin açıklamasını atlayacağım.

Ve böylece GVT (1985) tarafından elde edilen (I) ve (II) sonuçları aslında sıcak el lehine güçlü kanıtlardır. Miller ve Sanjurjo (2015) bunu gösterdi.


GVT'nin ileri analizi Tablo 4.

Birçoğu (örn. Aşağıdaki @scerwin) - GVT'yi (1985) okuma zahmetine girmeden - herhangi bir "eğitimli istatistikçinin" bu bağlamda ortalama ortalamalar alacağına inanmadığını ifade etmiştir.

Ancak bu, GVT'nin (1985) Tablo 4'te tam olarak yaptığı şeydir. Bkz. Tablo 4, sütun 2-4 ve 5-6, alt sıra. 26 oyuncunun ortalamasının,

ve p (H|1H)0.48,p^(H|1M)0.47p^(H|1H)0.48

ve p (H|2H)0.49,p^(H|2M)0.47p^(H|2H)0.49

ve p (H|3H)0.49.p^(H|3M)0.45p^(H|3H)0.49

Aslında bu durumda, her bir için , ortalama p ( H | k , H ), > p ( H | k M ) . Ancak GVT'nin argümanı, bunların istatistiksel olarak anlamlı olmadığı ve bu nedenle sıcak el lehine kanıt olmadığı görülmektedir. Tamam yeterince adil.k=1,2,3p^(H|kH)>p^(H|kM)

Ancak ortalamaları almak yerine (bazıları tarafından inanılmaz derecede aptalca kabul edilen bir hamle) yerine, analizlerini yeniden yaparız ve 26 oyuncu arasında (her biri için bazı istisnalar hariç 100 atış) toplanırız, aşağıdaki ağırlıklı ortalamalar tablosunu elde ederiz.

Any                     1175/2515 = 0.4672

3 misses in a row       161/400 = 0.4025
3 hits in a row         179/313 = 0.5719

2 misses in a row       315/719 = 0.4381
2 hits in a row         316/581 = 0.5439        

1 miss in a row         592/1317 = 0.4495
1 hit in a row          581/1150 = 0.5052

Tabloda, örneğin, 1.175 veya% 46.72'lik 26 oyuncu tarafından toplam 2.515 atış yapıldığı belirtiliyor.

Ve bir oyuncunun arka arkaya 3 kez kaçırdığı 400 durumdan 161 veya% 40,25'ini hemen bir hit izledi. Ve bir oyuncunun arka arkaya 3 isabet ettiği 313 durumun% 179'unu veya 57.19'unu hemen bir isabet izledi.

Yukarıdaki ağırlıklı ortalamalar sıcak el lehine güçlü kanıtlar gibi görünmektedir.

Her oyuncunun atışlarının kabaca% 50'sini yapabileceği belirlenen yerden atış yapacak şekilde atış deneyi oluşturulduğunu unutmayın.

(Not: "Garip bir şekilde", Tablo 1'de Sixers'ın oyun içi çekimi ile çok benzer bir analiz için, GVT bunun yerine ağırlıklı ortalamaları sunar. Öyleyse neden aynı şeyi Tablo 4 için yapmadılar? Kesinlikle Tablo 4 için ağırlıklı ortalamaları hesapladı - yukarıda sunduğum sayılar, gördüklerini beğenmediler ve onları bastırmayı seçtiler. Bu tür bir davranış maalesef akademideki kurs için eşittir.)


HHHTTTHHHHHHp^(H|3T)=1/1=1

p^(H|3H)=91/920.989


PS GVT'ler (1985) Tablo 4 çeşitli hatalar içermektedir. En az iki yuvarlama hatası tespit ettim. Ve ayrıca oyuncu 10 için, sütun 4 ve 6'daki parantez değerleri, sütun 5'teki değerden (en alttaki notanın aksine) birinden daha az eklemez. Gilovich ile temasa geçtim (Tversky öldü ve Vallone emin değilim), ancak maalesef artık orijinal hit ve özlüyor dizilerine sahip değil. Tablo 4 bizde.


GMT 1985'in 4. tablosuna bakarak 26 bireysel öğrenciyi test ettiler ve istatistiksel olarak anlamlı bir "sıcak el" in sadece bir örneğini buldular (her vakayı p <0.05'e karşı kontrol ettiler). Bu yeşil jöle fasulye etkisidir . Bir kenara, eğer her öğrenci, çekimlerinin yaklaşık% 50'sini yapabileceği şekilde doğru bir şekilde konumlandırıldıysa, öğrencilerin 7'sinden daha azının 100 üzerinden 40-60 aralığının dışında isabet oranları olması gerekir ( büyük bir sıcak el etkisi var)
Henry

4

(Feragatname: Bu literatürü bilmiyorum.) Bana öyle geliyor ki Miller ve Sanjurjo'nun belirli bir istatistiksel ölçüme ilişkin geçerli bir eleştirisi var. Bunun sadece el ölçüsü üzerinde odaklandıkları için, sıcak el etkisi üzerindeki tüm önceki çalışmaları geçersiz kılmayı düşünüp düşünmeyeceğini bilmiyorum.

Tedbir

M:=P(make shot | made previous shot)P(make shot | miss previous shot)
P(X)X

MEM>0EM=0

EM<0M

M


3

İki makalenin hiçbiri İstatistik uygulamalarına ilişkin yeterince açık değildir, bu yüzden bu cevapta bir açıklama yapmaya çalışacağım.

Gilovich, Mallone ve Tversky'nin (1985) kendi Özet tanımlar aşağıdaki şekilde "Sıcak El etkisi":

" Basketbolcular ve taraftarlar, bir oyuncunun bir vuruştan sonra şansını bir önceki vuruşta kaçırmayı takip etmekten daha büyük olduğuna inanma eğilimindedir. "

kHkkMk

(1)P(HHk)>P(HMk),k1

kompaktlık için, söz konusu atışın ardışık vuruşları veya kaçırmaları hemen takip eden atış olduğu anlaşılmalıdır. Bunlar, koşullu nispi ampirik frekanslar değil , teorik koşullu olasılıklardır (yani sabitler).

P^(HHk),P^(HMk)

Ho:P(HHk)P(HMk)=0

P(H)

TP^(HHk)P^(HMk)

T

T

Bu nedenle, Gilovich ve ark. kağıt, Hot-Hand'in tanımı değil, sıfır hipotezinin formülasyonu değil, kullanılacak istatistiğin seçimi değil: testleri yürütmek için kullanılan kritik değerlerin geçerliliği ( ve dolaylı dağıtım varsayımından ötürü), eğer gerçekten sınırlı, küçük örnek dağılımı (sıfır hipotezi altında), sıfırda ve ayrıca asimetrik olarak görünür bir şekilde merkezlenmezse.

Bu gibi durumlarda, genellikle testi gerçekleştirmek için özel kritik değerleri simülasyonla elde etmek gerekir (örneğin, bir birim kök için Dickey-Fuller testi için özel kritik değerleri hatırlayın). Miller-Sanjurjo gazetesinde böyle bir yaklaşım göremedim, "ortalama önyargı ayarlaması" yaptılar ve bu ayarlamadan sonra testin sonucunun tersine döndüğünü buldular. Bunun yolun olduğundan emin değilim.

200n=100p=0.5
T3=P^(HH3)P^(HM3)0.08070.07262.5%değerlerin negatif olması. Ampirik histogram

resim açıklamasını buraya girin


1

Bana göre, Miller ve Sanjurjo Tablo 1'deki bağıl frekansları yanlış hesapladılar. Tabloları aşağıda, iki jetonlu çevirmenin her dizisinde meydana gelen HH ve HT dizilerinin sayısını sayan iki yeni sütun eklendi. İstenen koşullu olasılığı p (H | H) elde etmek için, bu sayıları N (HH) ve N (HT) toplamalı ve sonra aşağıda gösterildiği gibi bölmeliyiz. Bunu yapmak beklendiği gibi p (H | H) = 0.5 verir. Bir nedenden ötürü, Miller ve Sanjurjo önce her bir sekans için nispi frekansı hesapladılar ve daha sonra sekanslar üzerinden ortalamayı aldılar. Bu açıkça yanlış.

Sequence     Subsequences       N(HH) N(HT)    p(H|H)
TTTT  ->  TT.. , .TT. , ..TT      0     0        -  
TTTH  ->  TT.. , .TT. , ..TH      0     0        -  
TTHT  ->  TT.. , .TH. , ..HT      0     1       0.0 
THTT  ->  TH.. , .HT. , ..TT      0     1       0.0 
HTTT  ->  HT.. , .TT. , ..TT      0     1       0.0 
TTHH  ->  TT.. , .TH. , ..HH      1     0       1.0 
THTH  ->  TH.. , .HT. , ..TH      0     1       0.0 
THHT  ->  TH.. , .HH. , ..HT      1     1       0.5 
HTTH  ->  HT.. , .TT. , ..TH      0     1       0.0 
HTHT  ->  HT.. , .TH. , ..HT      0     2       0.0 
HHTT  ->  HH.. , .HT. , ..TT      1     1       0.5 
THHH  ->  TH.. , .HH. , ..HH      2     0       1.0 
HTHH  ->  HT.. , .TH. , ..HH      1     1       0.5 
HHTH  ->  HH.. , .HT. , ..TH      1     1       0.5 
HHHT  ->  HH.. , .HH. , ..HT      2     1       0.66
HHHH  ->  HH.. , .HH. , ..HH      3     0       1.0 
                                 --    --       ----
                                 12    12       0.40
                            p(H|H)=N(HH)/N(H*)
                                  =12/(12+12)
                                  =0.5

Onların argümanı, bireysel TT ve TH olaylarını (yaptığınız gibi) hesaplamak yerine, p (H | H) olasılıklarının ortalamasının alınması gerektiğidir (çünkü tüm sekanslar eşit derecede olasıdır).
Giskard

1
Belki daha basit bir tablo hatalarını daha açık hale getirecektir. Sadece iki özel 4-flip dizisine izin verelim: TTHT ve HHHH. Bunlar 2-flipli alt dizileri verir: TT, TH, HT, HH, HH, HH. Bu listeden, ilk çevrilmiş jeton H'yi gösterdiğinde, başka bir H tarafından takip edilme olasılığı çok açıktır (bu, 4 defada 3 olur). Gerçekten bir "sıcak para"! Ancak Miller ve Sanjurjo'nun yöntemi hiç ısı tahmin etmeyecektir, çünkü TTHT ve HHHH (0.0 ve 1.0) için frekansların ortalaması 0.5'dir. Öte yandan, normal yöntem doğru cevabı verir: p (H | H) = 3 / (3 + 1) = 0.75.
scerwin

Demek istiyorum ki, onların belirttiğiniz bu 'hata', daha önce araştırmacıların yaptığı şeydi.
Kenny LJ

1
Olabilir. Fakat önceki araştırmacılarla ilgili bu iddia doğru mu? Hiç eğitimli bir istatistikçi, Miller ve Sanjurjo'nun Tablo 1'de yaptığı gibi bir olasılık hesaplayamaz. Bir beyzbol oyuncusunun vuruş ortalamasını hesaplamak, her oyun için ortalamasını hesaplamak ve sonra oyunların ortalamasını almak gibi bir şeydir. Sadece yanlış.
scerwin

"Ama bu önceki araştırmacılarla ilgili iddia doğru mu? Hiçbir eğitimli istatistikçi Miller ve Sanjurjo'nun Tablo 1'deki gibi bir olasılık hesaplayamazdı." Belki de söz konusu makaleleri okumak için zaman ayırmalısınız. Özellikle GVT (1985).
Kenny LJ

0

Gözlemlenen herhangi bir dizide, son koşul, daha sonra değer olmaması anlamında "eksik" tir. Yazarlar bununla, tanımsız olduklarını söyleyerek bunun gerçekleştiği durumları göz ardı ederek ilgilenmektedirler. Seri kısaysa, bu seçimin hesaplamalar üzerinde bariz bir etkisi olacaktır. Şekil 1 bu fikrin güzel bir örneğidir.


-1

Yukarıda yaptığım bir yorumu bir cevaba değiştireceğim ve asıl sorunun cevabının orijinal kağıtların doğru olduğunu iddia edeceğim. 2015 makalesinin yazarları, yorumda açıkladığım gibi, analizlerine mantıksal olarak dahil edilmesi gereken dizileri atıyorlar ve bu nedenle iddialarını destekleyen bir önyargı ortaya koyuyorlar. Dünya olması gerektiği gibi çalışıyor.

Yoruma yanıt olarak Zeyilname: Makalede tablo 1'e bakıyoruz. Son sütundan 4 değer attığımızı görüyoruz, bu yüzden beklenen farkı elde etmek için 16 diziden sadece 12'sini ortalıyoruz. Bu olasılıklara frekans olarak bakarsak ve ilk satır TTTT için, bir kafanın bir başı takip etme sıklığı nedir, sonra mantıksal olarak her zaman olur ve p'ye 1 (H, H ) sütunu, tire değil. Bunu attığımız diğer üç dizi için yapıyoruz ve farkın beklenen değerinin -.33 değil, 0 olduğu sonucuna varıyoruz. Verilerin net bir mantıksal yorumu olduğunda, böyle verileri dışarı atamayız.

Kaymanın ortadan kalkması için, kağıtta yapılmayan olasılıkları doğru bir şekilde hesaplamamız gerektiğini unutmayın. Tablodaki olasılıkların "bir başın bir kuyruğu takip etme olasılığı, bu dört atımlı dizide" olduğu iddia edilmektedir. TTTH sırası için, olasılığın 1/3 olduğuna inanmamız gerekiyor. Değil. Satırda dört fırlatma vardır ve bu satırdaki dört fırlatmadan biri "kafa kuyruğu takip eder" olayıdır. Olasılık 1/4. Bu yüzden olasılıkları doğru hesaplayın ve tüm satırları kullanın ve 30 yıl boyunca kabul edilen cevabı alırsınız.


Soru, Miller ve Sanjurjo'nun (2015) önceki araştırmacıların bir hata yaptığını (ve bu yüzden sıcak eli tespit edemediklerini) belirtmekte doğru olup olmadıklarıdır. Varsa, lütfen açıklayın. Değilse, lütfen açıklayınız. Asıl soru, “sadece böyle verileri atabilip atamayacağımız” ya da “dünyanın olması gerektiği gibi çalışıp çalışmadığı” değil.
Kenny LJ

Miller ve Sanjuro doğru değil, çünkü mantıksal olarak analize ait olan verileri atıyorlar ve bu nedenle dünyada olmayan bir önyargı ortaya koyuyorlar.
user164740
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.