Sınav sonucu binom midir?


31

İşte bana basit bir istatistik sorusu verildi. Gerçekten anladığımdan emin değilim.

X = bir sınavda kazanılan puanların sayısı (çoktan seçmeli ve doğru cevap bir puandır). X binom dağıtılmış mı?

Profesörün cevabı şuydu:

Evet, çünkü sadece doğru ya da yanlış cevaplar var.

Cevabım:

Hayır, çünkü her sorunun farklı bir "başarı olasılığı" var p. Anladığım kadarıyla, bir binom dağılımının her biri, belli bir başarı olasılığı olan p (ve hepsi p ile ilgili "özdeş" olan) basit bir sonuca (başarı veya başarısızlık) sahip olan bir Bernoulli deney dizisidir. Örneğin, bir (adil) madalyonun 100 kez çevrilmesi, bu 100 Bernoulli deneyidir ve hepsinde p = 0.5'tir. Fakat burada soruların farklı türleri var mı?


14
+1 Daha da önemlisi: bu gerçekten garip bir sınav olmadığı sürece, sorulara verilen cevaplar ile güçlü bir korelasyon gösterilecektir. Eğer , bir bireyin toplam puanı ise, bu Binom dağılımını engelleyecektir. Sorunun, bütün incelemelerin bağımsız ve rastgele tüm cevapları tahmin ettiği bir "boş hipotez" varsayımı altında çalışması mümkün olabilir mi? X
whuber

2
Ne kadar paradoksal, en azından bu konuda kısmi kredi için lobi yapmıştım, ama "cevap" ödüllendirmenin bir olumsuzluğunu yansıtıyor gibi görünüyor :) (tam burada olduğunuzu düşünüyorum).
AdamO

1
Evet, teşekkür ederim: D, bence daha çok Poisson binom dağılımı (eğer bir şey varsa)
Paul,

2
@ Zahava stats.stackexchange.com/search?q=poisson+binomial sayfasını ziyaret edin .
whuber

2
Sorunun zayıf olduğu konusunda herkesle aynı fikirdeyim, ancak burada bir çerçeveleme sorunu var. Eğer bu bir ilkokul dersi ise ve kısa cevaplı bir formatsa (nedenini açıklamak için bir şansın var), en iyi cevabın muhtemelen "evet (her soru için bağımsızlık ve eşit güçlük varsayarak") "olduğunu söyleyebilirim; Bu profesöre (1) sorunun sınırlarını anladığınızı ve (2) akıllı bir eşek olmaya çalışmadığınızı gösterir.
Ben Bolker

Yanıtlar:


25

Cevabınıza katılıyorum. Genellikle bu tür veriler günümüzde bir tür Madde Tepki Teorisi modeli ile modellenir . Eğer kullanılan Örneğin, Rasch modeli , daha sonra ikili cevap olarak modellenmiş olacakXnben

Pr{Xnben=1}=eβn-δben1+eβn-δben

burada βn olarak düşünülebilir -inci kişiler yetenek ve ö i olarak ben -th soru zorluk. Bu yüzden model, farklı kişilerin yeteneklerde ve soruların zorlukta değiştiği gerçeğini anlamanızı sağlar ve bu IRT modellerinin en basitidir.nδbenben

Sizin profesörler cevap binom toplamı bir dağılım olduğu tüm sorular, "başarı" aynı olasılığına sahip ve bağımsız olduğunu varsayar Bernoulli denemeleri IID. Yukarıda açıklanan iki tür bağımlılığı görmezden gelir.n

Yorumlarda görüldüğü gibi, belirli bir kişinin cevaplarının dağılımına bakarsanız (bu nedenle, kişi arasında değişkenliğe önem vermek zorunda kalmazsınız) ya da aynı öğedeki farklı kişilerin cevaplarına bakabilirsiniz (yani hiçbir et değişkenlik), daha sonra dağıtım Poisson binom, toplamının, yani dağıtım olacaktır olmayan IID Bernoulli denemeleri. Dağıtım yaklaşım yapılabilir binom veya Poisson ile, ama hepsi bu. Aksi halde, varsayımı yapıyorsunuz.n

Tahmin etme konusundaki "null" varsayımı altında bile, bu, tahmin kalıplarının olmadığını varsaymaktadır, bu yüzden insanlar tahmin ettikleri şekilde farklı değildir ve maddeler tahmin edildikleri şekilde farklılık göstermez - bu yüzden tahmin tamamen rastgeledir.


Bu mantıklı! Her ne kadar bir sorunun başarı olasılığını hesaplayabileceğinizi tahmin etsem de "şahıs kabiliyeti" kulağa zor geliyor :) Yaptığım bir başka fikir de bunu bernulli dağılımlarının toplamı olarak modellemek mi? Örneğin, 2 soru, dolayısıyla 2 başarı olasılığı p1 ve p2 olduğunu varsayalım. Benzer şekilde iki değişken X1 ve X2 sayımı (yani 2 bernulli deneyi). O zaman, örneğin toplam 1 puan alma olasılığı P (X1 = 1) * P (X2 = 0) + P (X1 = 0) * P (X2 = 1) = p1 (1-p2) + (p1) 1) p2. Bu mantıklı geliyor mu?
Paul,

2
İki Bernoulli farklı p en ile toplamına @ Paul Poisson-binom olduğu
Tim

4
"Boş" varsayım temelde küresel bir ineğe ait bir şeydir; ineğin ne kadar küresel olduğu hakkında her zaman titiz olabilirsiniz.
Hong Ooi

5

Bu sorunun cevabı, sorunun çerçevesine ve ne zaman bilgi edinildiğine bağlıdır. Genel olarak, profesör ile aynı fikirdeyim ama onun cevabının açıklamasının zayıf olduğunu ve profesörün sorusunun daha fazla bilgi içermesi gerektiğini düşünüyorum.

Sınırsız sayıda potansiyel sınav sorusu düşünürseniz ve soru 1 için rastgele birini seçerseniz, soru 2 için rastgele bir tanesini çizin. Sonra sınava girersiniz:

  1. Her sorunun iki sonucu vardır (doğru ya da yanlış)
  2. Çok sayıda denemeler var (sorular)
  3. p bunu doğru yapma , birinci soruya girme ile aynıdır)

Bu çerçevede, bir binom deneyinin varsayımları karşılanmaktadır.

Ne yazık ki, kötü teklif edilen istatistiksel problemler sadece sınavlarda değil pratikte çok yaygındır. Profesörün gerekçesini savunmakta tereddüt etmem.


Jea, sanırım bu da doğru. Soru sadece "kötü", çünkü her iki şekilde de tartışabiliyorsunuz, çünkü çok az bilgi verildi. Ama profesörümün verdiği cevaptan çok mutsuzdum.
Paul,

4
@ Paul, aslında iyi istatistiksel sorular yazmak oldukça zor. Biliyorum, pek çok kez burayı salladım.
gung - Reinstate Monica

1
If you consider an infinite number of potential exam questions, and you draw one at random for question 1, draw one at random for question 2, etc.- Bence sınav sorularının potansiyel sorular havuzundan bağımsız olarak alındığı varsayımını açıkça belirtmelisiniz. İlişkilendirilmeleri onlar için daha gerçekçi olurdu: 1. soru kolaysa, kolay bir sınav yaptırmanız muhtemeldir ve 2. soru kolay olacaktır.
Adrian

0

Eğer n soru varsa ve p sorusuyla herhangi bir soruyu doğru cevaplayabilirsem ve tüm soruları cevaplamaya çalışmak için yeterli zaman var ve bu testlerden 100 tane yaptım, o zaman puanlarım np ortalamasıyla dağıtılacaktı.

Fakat testi 100 defa tekrarlamam benim, her biri kendi olasılıkları olan bir test yapan 100 farklı aday p. Bu p'lerin dağılımı en önemli faktör olacaktır. Konuyu iyi çalıştıysanız p = 0.9, eğer yapmadıysanız p = 0.1, 0.1 ile 0.9 arasında çok az kişiyle bir test yapmış olabilirsiniz. Noktaların dağılımı 0,1n ve 0,9n'de çok güçlü maksimaya sahip olacak ve normal dağılıma yakın olmayacak.

Öte yandan, herkesin herhangi bir soruyu cevaplayabileceği, ancak farklı miktarlarda zaman alabileceği testler var, bu nedenle bazıları n'nin tüm sorularına cevap verecek, diğerleri ise daha az cevap verecek çünkü zamanları tükeniyor. Adayların hızının normal dağılıma sahip olduğunu varsayabilirsek, puanlar normal dağılıma yakın olacaktır.

Ancak birçok test bazı çok zor ve çok kolay soruları içerecektir, böylece kasten en iyi adayları (bir dereceye kadar tüm sorulara cevap verecek olan) ve en kötü adayları (sadece çok fazla cevap verebilecek olan) arasında ayırabiliriz. basit sorular). Bu, noktaların dağılımını oldukça güçlü bir şekilde değiştirecektir.


2

2
@Tim Normal dağılımlara olan gereksiz güvene ve 100 teste girme gizemine rağmen, bu cevap belirli bir durumun açıkça binom olmayan bir dağılıma nasıl yol açabileceğini göstermeye çalışmakta hak ediyor. Bu nedenle, bu teknik sorunların ele alınması, cevaplara değerli bir katkı olabilir.
whuber

0

n n

n

  • 12
  • Are bağımsız . Birçok sınav, önceki soruların cevaplarına dayanan sorular soruyor. Bunun, bu soruda sınavda olmayacağından emin olduğunu kim söyleyebilir? Sınav sorularına birbirinden bağımsız olmayan cevaplar verebilecek başka faktörler var, ama bence bu en sezgisel olarak açık.

Sınav sorularını binom olarak modelleyen İstatistik derslerinde sorular gördüm, ancak bunlar boyunca bir şey çerçeveli:

Hangi olasılık dağılımı, her sorunun dört seçeneğe sahip olduğu ve her sınava giren öğrencinin her cevabı rasgele tahmin ettiğini tahmin ettiği çoktan seçmeli bir sınavda doğru cevaplanan soru sayısını modelleyecektir?

Bu senaryoda, elbette ile bir binom dağılımı olarak gösterilecektir.p=14


Gerçeklerinizle ilgili hiçbir sorun yok, ancak mantık yanlıştır: bazı varsayımların geçerli olmayabileceğini göstermek yeterli değildir, çünkü (mantıksal olarak) dağıtım her durumda yine de binom olabilir. Ayrıca, bu varsayımların, puan dağılımının kesinlikle binom olmayan olmasına neden olacak şekilde başarısız olabileceğini göstermeniz gerekir.
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.