Neden 1000’den 600’ü 10’dan 6’sından daha ikna edici?


41

Bu alıntıya "Çalışma becerileri el kitabı", Palgrave, 2012, Stella Cottrell, sayfa 155:

Yüzdeler Yüzdelerin verildiğine dikkat edin.
Bunun yerine, yukarıdaki ifadenin okuduğunu varsayalım:

İnsanların% 60'ı portakalları tercih ediyordu; % 40'ı elmaları tercih ettiklerini söyledi.

Bu ikna edici görünüyor: Sayısal nicelikler verildi. Ancak% 60 ile% 40 arasındaki fark önemli midir? Burada kaç kişiye sorulduğunu bilmemiz gerekir. 600'ü portakal tercih eden 1000 kişiye sorulursa, bu sayı ikna edici olur. Bununla birlikte, sadece 10 kişiye sorulduğunda,% 60, basitçe 6 kişinin tercih ettiği portakal anlamına gelir. "% 60", "10 üzerinden 6" çıkmadığı konusunda ikna edici geliyor. Kritik bir okuyucu olarak, yetersiz verilerin etkileyici görünmesini sağlamak için kullanılan yüzdeleri aramanız gerekir.

İstatistiklerde adlandırılan bu özellik nedir? Bunun hakkında daha fazla okumak istiyorum.


38
örneklem büyüklüğü önemli
Aksakal

36
İki kişiyi rastgele seçiyorum, ikisi de erkektir ve bu nedenle Amerikalıların% 100'ünün erkek olduğu sonucuna varıyorum. İnandırıcı?
Casey,

2
"Elmaları portakal ile kıyaslama" ilkesidir
wolfies 19

2
Bu soruya farklı bir açıdan yaklaşmak için, çerçeveleme etkisinin literatürünü kazmayı düşünebilirsiniz. Ancak bilişsel önyargı örneğidir ve istatistiksel olarak değil, psikolojik bir konudur.
Larx,

2
Tahmini miktarı ne kadar etkileyeceğini 1 fark edersiniz. 7/10, göreli olarak 6 / 10'dan 601 / 1000'den 600 / 1000'den çok daha fazladır.
mathreadler

Yanıtlar:


54

Başka bir sezgisel örneği listelemek istiyorum.

Diyelim ki herhangi bir jeton çevirisinin sonucunu tahmin edebileceğimi söyleyeyim. İnanmıyor ve yeteneğimi test etmek istiyorsun.

5 kez test ettin ve hepsini doğru yaptım. Özel bir yeteneğim olduğuna inanıyor musun? Belki de değil. Çünkü hepsini tesadüfen bulabilirim. (Özellikle, bozuk para hilesiz bir para olduğunu varsayalım ve her deney sonra ben tüm haklarını alabilir, bağımsız hiçbir süper güç. Bkz Shufflepants en linki bununla ilgili bir şaka).0.550.03

Öte yandan, eğer beni çok fazla test ettiyseniz, o zaman şans eseri elde edebileceğim çok düşük bir ihtimal. Örneğin, kez test ettiyseniz , hepsini doğru bulma olasılığım .0.5 10001000.51000


Wikipeida’dan istatistiksel kavram olarak istatistiksel güç denir.

İkili hipotez testinin gücü, alternatif hipotez (H1) doğruyken testin boş hipotezi (H0) doğru şekilde reddetme olasılığıdır.

Bozuk para çevirme örneğindeki süper güce geri dönelim, aslında bir hipotez testi yapmak istiyorsunuz.

  • Boş hipotez (H0): Süper gücüm yok
  • Alternatif hipotez (H1): Süper gücüm var

Sayısal örnekte görebileceğiniz gibi (beni 5 kez test et - beni 100 kez test et), istatistiksel güç örneklem büyüklüğünden etkilendi.

Burada okumak için daha fazla . (daha teknik ve t testine dayalı).

İstatistiksel gücü anlamak için etkileşimli bir araç burada bulunabilir . İstatistiksel gücün örneklem büyüklüğüne göre değiştiğini unutmayın!

görüntü tanımını buraya girin


24
Zorunlu XKCD
Shufflepants

5
Bu aslında soruyu cevaplamıyor. Sorunun iki bölümü var: “Neden bu daha inandırıcı…” ve “İstatistikte bu özellik nedir?” Örnekle daha fazla ikna edilip edilmediğini sormak için okuyucuyu soran bir örnek verdiniz, ancak fenomeni açıklamamışsınız veya bunun neden daha ikna edici olduğunu ele almaya çalışmadınız (sadece okuyucunun tek bir örnekte sezgisel akıl yürütmesine dayanarak). Ayrıca, ikinci soruya değinmediniz: Bu olgunun bir adı olmadığını düşünüyorsanız, açıkça belirtiniz.
Makyen

1
@ Mayken Bu kesinlikle denenmiş bir cevaptır. Bu en büyük cevap değildir ve tam bir cevap değildir, ancak kısmi ya da sosyal cevaplar bir cevap olmadığını iddia etmek için temel teşkil etmez. Sorular bir soru sormalı ve bir dizi soru soruyorlarsa, sadece bazılarına hitap etmenin tamamen uygun olduğunu düşünüyorum (idealden daha azsa). Bunun kötü bir cevap olduğunu düşünüyorsanız , sorun olarak gördüğünüz sorunları çözmekte kesinlikle özgürsünüz. [Bu konuda ikinci soruyu da cevapladığımı sanmıyorum; Sadece etkisini tartıştım; Her fenomen açık bir isme sahip olmayacaktır]
Glen_b

1
Yardım edemem ama% 100 özel bir durum gibi hissediyorum ve bu cevap 600/1000'in 6/10'den daha inandırıcı olduğu yönündeki fikrimi desteklemiyor. Özel bir durum olmasa bile, bu aslında sorunu farklı bir yüzdeyle yeniden düzenlemek.
NotThatGuy

2
@Juya, birisi tarafından yaptırılan web tabanlı bir araçtır. Burada
Haitao Du

29

μ=# of sucessesn

Bu miktarın standart hatasının olduğu tahmin edilmektedir.μ(1μ)n.155.0155


17

Bu kavram, büyük sayılar yasasının bir sonucudur . Gönderen Vikipedi ,

Yasaya göre, çok sayıda denemeden elde edilen sonuçların ortalaması beklenen değere yakın olmalı ve daha fazla deneme yapıldığı için daha yakın olma eğiliminde olacaktır.

Küçük bir numuneden elde edilen sonuçlar daha büyük bir numuneden beklenenden daha uzak olabilir. Dolayısıyla, soruda belirtildiği gibi, küçük örneklerden hesaplanan sonuçlara dikkat edilmelidir. Fikir, bu youTube videosunda da oldukça iyi açıklanmıştır .


5
İstatistiklerde "büyük sayılar kanunları" olarak bilinen birkaç tanınmış teorem var, ancak hiçbiri soruya benzeyen ifadeler yapmıyor. O zaman bağlantıyı nasıl kurarsınız?
whuber

3
Wikipedia adresinden en.wikipedia.org/wiki/Law_of_large_numbers , "Yasaya göre, çok sayıda denemeden elde edilen sonuçların ortalaması beklenen değere yakın olmalı ve daha fazla deneme yapılırken daha da yaklaşma eğiliminde olacak" . Küçük bir numuneden elde edilen sonuçlar daha büyük bir numuneden beklenenden daha uzak olabilir. Dolayısıyla, soruda belirtildiği gibi, küçük örneklerden hesaplanan sonuçlara dikkat edilmelidir.
Evan Phibbs

6
Bu iyi bir açıklama, teşekkür ederim. Yasanın güvenilmesi için ne kadar “çok sayıda yargılama” yapılması gerektiğine dikkat etmeniz gerektiğine karar vermek doğru olsa da, uygulama sezgisel olarak sağlamdır. Açıklamanızın, bir yorumun içine gömülmek yerine, daha yaygın olarak okunup takdir edileceği cevabınıza ait olduğunu belirtmek isterim. Sadece linksiz cevaplar (Youtube linkiniz gibi) açıklama yapmadan burada bitmez.
whuber

6

Bazı nüfus miktarını, bazı örnek miktarlarıyla tahmin etme durumundayız. Bu durumda, nüfus oranlarını tahmin etmek için örnek oranlar kullanıyoruz, ancak ilke oldukça genel.

10101

Daha büyük ve daha büyük örnekler aldığımızda (rastgele örnekleme kullanarak), örnekleme araçları popülasyon ortalamasına yakınlaşma eğilimindedir. (Bu büyük sayılar yasasıdır.)

Bununla birlikte, gerçekte bazı fikirlere sahip olmak istediğimiz şey ne kadar uzakta olabileceğimizdir (örneğin, oran için bir güven aralığı genişliği veya normalde bu genişliğin yarısı olan hata payı ile temsil edilebilir) .

120

Örnek ortalamasının dağılımının standart sapması, bir örnek ortalamanın popülasyon ortalamasına olan tipik mesafesini ölçmenin bir yoludur (azalan ( gibi azalır).1n

Sonuç olarak, örnek büyük olduğunda tahmininizin doğruluğu konusunda daha fazla güveniyoruz - tekrar denememizi tekrar yaparsak, bu tür araçlar mevcut olana yakın olurdu - daha sıkı bir şekilde kümelendiriyorlar ve Çünkü (bu durumda) tahminimiz tarafsızdır, tahmin etmeye çalıştığımız değerler etrafında toparlanırlar. Tek bir örnek ortalama, popülasyon ortalamasının nerede olabileceği konusunda daha fazla bilgilendirici hale gelir.


4

Portakal gibi insan sayısının sayılması veya radyoaktif bozulma nedeniyle bir Geiger sayacındaki "tıklama" sayısının sayılması gibi, "sayım" istatistiklerine ilişkin bir kural, sayım için hata payının kabaca karesi olmasıdır. Beklenen sayım değerinin-kökeni. Sayma istatistikleri Poisson istatistikleridir.

6'nın karekökü 2.4-s'dir, bu nedenle hata payı yaklaşık% 40'tır (2.4 / 6). 600'ün karekökü 24-s'dir, bu nedenle hata payı yaklaşık% 4'tür (24/600). Bu nedenle, 600'ü saymak, 6'yı saymaktan daha önemlidir. Göreceli hata onda biri.

Hata payının tanımı konusunda biraz özensiz oluyorum. Bu gerçekten 1-sigma değeri ve zor bir kesim değil, ölçümlerin çoğunun (% 68) yalanını beklediğiniz aralık. Yani, 6 portakal yiyicisini beklerseniz, bir dizi anketin size en fazla 4 ila 8 aralığında (6,6,5,6,7,2,4,6,3,5,6) sayı vermesini beklersiniz. 6,7,6,10,8,6,5,6,6,9,3,7,8.


3

Aradığınız isim bende değil ama sorun istatistiksel değil. Psikolojik olarak, insanların beynimizdeki sayıları işleme şekli, büyük sayılardan daha küçük sayılara göre daha fazla ağırlık (otorite) sağlar çünkü büyüklük (fiziksel boyut) görsel olarak temsilci değer kadar önemlidir. Böylece, 600/1000, 6/10'den daha güvenilir görünüyor. Bu nedenle müşterilerin "% 10 İndirim!" 100'den küçük ve "10 $ Kaydet!" 100'ün üzerindeki değerler için ("100 Kuralı" olarak adlandırılır). Beynimizin algıya nasıl tepki gösterdiği ile ilgili.

Bu ve benzeri tür olaylara inanılmaz bir bakış, Nick Kolenda tarafından " Fiyatlandırma Psikolojisine Yönelik Büyük Bir Rehber " adlı çevrimiçi makalesinde tartışılmaktadır .


2
Diğer cevaplar yanlış olmasa da, alıntılanan metni olduğu gibi doğru bir şekilde hitap ederken görmüyorum. Metin, sayılar gerçekten daha doğru değilse, sayıları ve algılanan doğruluğu sunmanın etkisini ele almaktadır. Yani, bir kişiyi, bilgilerinizin% 1000 veya% 60'ı söyleyerek daha önemli olduğunu algılayabilir veya her birinin daha küçük bir örnek uygulayarak aynı şeyi ifade etmesine rağmen, 10'un 6'sını söyleyerek daha az önemli görünmesini sağlayabilirsiniz. gerçekte belirtilmişse, hatta muhtemelen doğru olsa bile boyut.
dlb,

1
Bu örnek bence temelde kusurlu görünüyor. Örneğin, 100'lük bir alım toplam 90 için% 10 indirim alırken, 100.01'lik bir alım toplam 75.01 için 25 indirim alır; bu da sonuçta çok farklı bir fiyattır. Aslında, 250.05'e kadar (veya yuvarlama veya kesme işlemine bağlı olarak 250.10) çıkana kadar değerler arasında bir fark vardır. Soru, örneklem büyüklüğü ve standart hatadan bahsederken, örneğiniz bizim algımızdan dolayı gerçek bir farkla ilgili.
Joe W,

@Joe W, "100 kuralı" nın (psikolog olmamak) özelliğiyle konuşamıyor olsam da, cevabımın verdiği nokta, psikologların insanların daha büyük bir sayıya değil, daha büyük bir sayıya güvendiğini belirledikleridir. temsil ettiği örneklem büyüklüğü, ancak daha büyük bir sayıya verilen büyük önem algısı nedeniyle. Bir mühendis olarak, böyle olmamasını tercih ederim --- insan zihninin çalışma şekli. Buna itiraz etmek isterseniz, Bay Kolenda'nın sunumunun altta yatan ayrıntılarını okumanızı tavsiye ederim.
JBH

Sen benim noktayı kaçırıyorsun,% 10 ile 100 arasında daha büyük bir fark var ve bu sadece bir algı meselesi değil. Asıl gerçek şu ki, her iki değeri de 100'de aldıysanız, 10'dan biri ve 1000'den biri olan iki farklı örnek konuşurken, standart hatayı ölçmek için çok daha basit olan bir değer olan% 15'lik bir fark vardır.
Joe W

Sorumu size yardımcı olmak için% 10 ve 10 $ kullanacak şekilde değiştirdim. "100 kuralı" nın amacı, insanların daha büyük sayıları daha fazla alaka düzeyi olarak algıladıkları ve parasal değeri yalnızca yüzde yüzünden daha önemsiz olarak algıladıklarıdır. Bu, OP'nin amaçları için tartışmanın kapsamı dışında kalan bir konudur.
JBH,

3

İken fiili hata payı önemlidir, bu nedenle sesler daha ikna çünkü insanlarla tecrübe daha sezgisel (başparmak üstünlüğü) taşımaktadır. Gerçek hata marjı, bu buluşsal bulgunun haklı olduğunu onaylar.

Eğer örnek 6 için ve 4'e karşı 4 ise, tek bir kişi oylarını değiştirirse veya tek bir kişi yanlışlıkla kaydedildiyse, bu 50/50 olabilir. 6 tarafta sadece iki kişi daha var. Herkes iki pul tanıyor, herkes numunenin kirazla toplanabileceğini biliyor: Sadece garsonlara soruyordunuz ve başka kimseye sormadınız. Ya da sadece bir üniversite salonlarında 10 üniversite profesörü yokladı. Ya da Saks Beşinci Cadde dışında 10 varlıklı kişiye sordun.

Matematiksel hata marjı bile gerçek rasgeleliği varsayar ve seçim önyargısını ya da kendi seçim önyargısını ya da başka herhangi bir şeyi hesaba katmaz, insanlar bunu sezgisel olarak anlayabilir.

Buna karşılık, 600'e karşı 400 sonuç bir tarafta diğerinden 200 kişiden daha fazlasına sahip ve 100 kişi fikrini değiştirmek zorunda kalacak. Bu sayıların, sandığın bir kazada, insanların nasıl aynı fikirde olduğunu, kişilerin soruyu nasıl anladığını veya yorumladığını, vb. Karşılaması çok zor (ama imkansız değil).

Olması gerektiğine dair matematiksel bir kanıt olmadığı için daha ikna edici, ancak 1000 kişiden oluşan kitlelerin görüşlerinde (herhangi bir şey için) 10 gruba göre daha fazla çeşitlilik gösterme ihtimalinin yüksek olduğunu biliyoruz (gizlice yapmadıysanız) Bir siyasi parti kongresinde ya da bir KKK mitinginde ya da tek taraflı bir kalabalık çekmesi muhtemel başka bir şeye oy vermeniz).

Matematik, yalnızca sezgilerle zaten bildiklerimizi kesin olarak ölçüyor; rastgele rastgele rastlamak, 10 üzerinden bir veya iki sıradışı oyla rastgele rastlamaktan daha kolay;


3

Bahsedilmemiş bir şey, soruna Bayes bakış açısıyla bakmaktır.

pp

pBeta(α,β)no|pBin(n,p).

β=αβ=α=1pU(0,1)

nnona=nno

p

p|no,naBeta(no+1,na+1).

pno/(no+na)n

no=6na=4

n_o = 6 ve n_a = 4 ile arka

no=600na=400görüntü tanımını buraya girin

p=0.4p=0.8

Lütfen bu arazilerin david25272'lere benzemesine rağmen, çok farklı bir şeyi temsil ettiklerini unutmayın .

pno

nop


2

Kısa cevap:

Temel olarak, 1000'den 600'ü 10'dan altıya sahip olmak daha ikna edicidir, çünkü eşit tercihler verildiğinde, 10'dan 6'sının rastgele tesadüfen oluşması çok daha muhtemeldir.

Farz edelim - portakal ve elmayı tercih eden oranın gerçekte eşit olduğu (her biri% 50). Buna boş hipotez de. Bu eşit olasılıklar göz önüne alındığında, iki sonucun olasılığı:

  • 10 kişiden oluşan bir örnek verildiğinde , rastgele portakal tercih eden 6 kişi veya daha fazla kişiden örnek alma şansı% 38'dir (ki bu pek de mümkün değildir).
  • 1000 kişiden oluşan bir örneklemle milyarda 1 veya daha az kişi olma ihtimalinin 600'den fazla olması veya 1000 kişiden fazlasının portakalları tercih etmesi.

(Basit olması için sınırsız sayıda örnek alabileceği sonsuz bir popülasyon olduğunu varsayıyorum).


Basit bir türev

Bu sonucu elde etmenin bir yolu, örneklerimizde insanların bir araya gelebilecekleri potansiyel yolları listelemektir:

On kişi için kolay:

Elma veya portakal için eşit tercihleri ​​olan sonsuz bir insan popülasyonundan rastgele 10 kişinin örneklerini almayı düşünün. Eşit tercihlerle, 10 kişinin tüm potansiyel kombinasyonlarını kolayca listeleyebilirsiniz:

İşte tam listesi.

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r, sonuçların sayısıdır (portakalları tercih eden insanlar), C, birçok insanın portakalları tercih etmesinin muhtemel yollarının sayısıdır ve p, birçok insanın portakalları tercih etmesinin sonuçta ortaya çıkan olasılıklarıdır.

(p sadece toplam C kombinasyonuna bölünen C'dir. Bu iki tercihin toplamının düzenlenmesi için 1024 yol bulunduğunu unutmayın (2'ye 10'a kadar).

  • Örneğin, 10 kişi için (r = 10) sadece bir yol (bir örnek) var. Aynısı elmaları tercih eden herkes için de geçerlidir (r = 0).
  • Dokuzunun portakalları tercih etmesiyle sonuçlanan 10 farklı kombinasyon vardır. (Bir farklı kişi her örnekte elmaları tercih eder).
  • 2 kişinin elma, vb. Tercih ettiği 45 örnek (kombinasyon) vardır.

(Hakkında genel biz konuşmasında C r n sonuçların kombinasyonları r bir örnekten n insanlar. Bu sayıları doğrulamak için kullanabileceğiniz online hesap makineleri vardır.)

Bu liste bize sadece bölme kullanarak yukarıdaki olasılıkları vermemizi sağlar. Portakalı tercih eden örnekte 6 kişiyi alma şansı% 21'dir (kombinasyonların 1024'ü 210). Örneğimize altı veya daha fazla kişi girme şansı% 38'dir (altı veya daha fazla kişiyle tüm örneklerin toplamı veya 1024 kombinasyonun 386'sı).

Grafiksel olarak, olasılıklar şöyle görünür:

binom örneklem büyüklüğü 10

Daha büyük sayılarla, potansiyel kombinasyonların sayısı hızla artar.

Sadece 20 kişiden oluşan bir örnek için, hepsi eşit olasılıkla 1,048,576 olası örnek bulunmaktadır. (Not: Sadece aşağıdaki her ikinci kombinasyonu gösterdim).

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

20 kişinin hepsinin portakalı tercih ettiği tek bir örnek var. Karışık sonuçlar içeren kombinasyonlar çok daha muhtemeldir, çünkü numunelerdeki insanların birleştirilebilmesi için daha birçok yol vardır.

Önyargılı örnekler çok düşük bir ihtimaldir, çünkü bu örneklerle sonuçlanabilecek daha az insan kombinasyonu vardır:

Her örnekte sadece 20 kişi olması durumunda, örneklemimizde portakal tercih eden% 60 veya daha fazla (12 veya daha fazla) kişinin kümülatif olasılığı sadece% 25'e düşer.

Olasılık dağılımının daha ince ve daha uzun olduğu görülebilir:

binom örneklem büyüklüğü 20

1000 kişiyle sayılar çok fazla

Yukarıdaki örnekleri daha büyük örneklere uzatabiliriz (ancak tüm kombinasyonları listeleyebilmesi için rakamlar çok hızlı büyüyor), bunun yerine R'deki olasılıkları hesapladım:

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

1000 kişiden 600 veya daha fazlasına sahip olma kümülatif olasılığı sadece portakalları tercih eder 1.364232e-10.

Olasılık dağılımı artık merkez çevresinde daha yoğunlaşıyor:

[binom örneklem büyüklüğü 1000 [3]

(Örneğin, R kullanımında dbinom(600, 1000, prob=0.5)4.633908e-11'e eşit olan portakalları tercih eden 1000 kişiden tam olarak 600'ünün olasılığını hesaplamak için ve 600 veya daha fazla kişinin olasılığı 1-pbinom(599, 1000, prob=0.5)1.364232e-10'a (milyarda 1'den az) eşittir.


1

Bunun nedeni, daha yüksek sayının daha fazla doğruluk sağlamasıdır. Örneğin, gezegenin herhangi bir yerinden 1000 rastgele insanı toplarsanız ve 599'u 6 erkekli 10 rastgele kişiye karşı erkektir, birincisi daha doğru olacaktır. Benzer şekilde, 7 milyar nüfusa sahipseniz ve erkek sayısını hesaplarsanız, açıkça yalnızca 1000 kişiden daha ikna edici olan daha kesin bir rakam elde edersiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.