Bir seçimde, bir adayın kazanan olacağını kesin olarak nasıl söyleyebiliriz?


14

Dün yaşadığım genel bir seçim vardı ve televizyon ağı tüm oy pusulaları açılmadan çok önce kazananları aramaya başladı.

Tüm hesaplarda ortaya çıktılar ve yaptıkları için gerçekten şaşırmadım. İstatistiklerin kesinlikle geçerli olduğunu biliyorum. Yine de merak ediyorum. varsayarsak:

  • Açtığımız dışına j pusulaları;ij
  • Elimizdeki güncel olarak puanları adayları c 1 , c 2 , c 3 , . . . c n ;nc1,c2,c3,...cn

Önde gelen adayın kazanan olduğu kesinliği nasıl hesaplayabiliriz?


1
Genellikle kapsamlı çıkış yoklama verilerine ve sonucu tahmin etmek için kullanabilecekleri diğer verilere erişebileceklerini unutmayın . Örnekleme hatası nedeniyle işaretin dışında olmadıklarından emin olmak için gelen sayıdan yeterli onay almaları gerekir. Kesinlikle karmaşıklıklar vardır ve gelen sayımlar genellikle taraflı bir örnektir, ancak çıkış anketleri bu sorunların bazılarını ele almalarına yardımcı olmak için uzun bir yol kat etmektedir.
gung - Monica'yı eski durumuna getirin

1
Eğer "kesin olarak" tam anlamıyla alınacaksa, istatistikler (neredeyse?) Hiçbir zaman "kesin" bir soruya cevap veremez. Ancak, cevabın doğru olacağına dair yüksek bir güvenle cevap verebiliriz. (Başka bir deyişle, verilerimizi alır ve analizlerimizi doğru yaparsak, "Cevabım yalnızca% x oranında yanlış olacaktır." Gibi şeyler söyleyebiliriz.)
Emil Friedman

Yanıtlar:


14

Uygulamadaki temel zorluk, şans eseri bir şansın bir adaya daha fazla oy vereceğine dair istatistiksel belirsizlik değildir. Ana zorluk, büyüklük veya daha fazla bir sırayla, açılan oylamaların neredeyse hiçbir zaman kullanılan oyların tarafsız bir örneği olmamasıdır. Bu etkiyi görmezden gelirseniz, büyük bir önyargılı örnekle oluşan ünlü "Dewey Defeats Truman" hatasını alırsınız .

Uygulamada, bir adayı diğerine tercih eden seçmenler, gün içinde çalışıp çalışmalarına veya yurtdışına yerleştirilip yerleştirilmeyeceklerine göre bölgeye göre eşit olarak dağıtılmazlar. Bunlar küçük farklar değil.

Bence haber kuruluşlarının yaptıkları, popülasyonu gruplara ayırmak ve sonuçları her grubun nasıl oy kullandığını (katılım dahil) tahmin etmek için kullanmaktır. Bunlar, sadece bu seçimden elde edilen verilere değil, önceki seçimlere dayanan modellere ve önceki varsayımlara dayandırılabilir. Bunlar Palm Beach'in kelebek oy pusulaları gibi tuhaflıkları hesaba katmayabilir .


3
Yaklaşık 10-15 yıl öncesine kadar Avustralya'da muhafazakar partiler genellikle ilk sayımlarda güçlenmeye başladılar, ilerici partiler geç geri dönüş yaptılar. TV ağları muhtemelen neler olduğunu biliyordu, ancak değişkenlik muhtemelen daha fazla drama için yapılmıştı. Antony Green adında bir analist adı, kırsal alanlardaki küçük standların sayılarını yapma ve erken sonuç verme eğilimlerini ve daha muhafazakar bir şekilde oy kullanma eğiliminde olduklarını hesaba katmak için stand sonuçlarını stant kullanmaya başladığında her şey değişti. Antony, bunu herkesin kullanmasından saatler önce seçim sonucunu doğru bir şekilde çağırdı.
Bogdanovist

1
Önceki yılların kabin sonuçlarına göre stand, toplam sonucun tahminlerini çok doğru bir şekilde kalibre etmek için kullanılabilir.
Peter Ellis

@DouglasZare Sanırım şu anda açılmış olan oy pusulalarının rastgele bir örnek olmadığı anlamına geliyorsunuz.
Michael R. Chernick

1
@Michael Chernick: Rasgele olmayan bir örnek ile yanlı bir örnek arasındaki fark nedir? en.wikipedia.org/wiki/Sampling_bias bunları eş anlamlı olarak kullanıyor gibi görünüyor.
Douglas Zare

1
@DouglasZare Bağlantınızdan wikipedia'nın rasgele olmayan bir eş anlamlı olarak eş anlamlı örnek kullandığını görüyorum. Bence bu kötü bir seçim. Genel önyargı, bir tahmin edicinin parametrenin gerçek değerine eşit olmaması beklentisini ifade eder. Örnekleme bağlamında, rastgele olmayan bir örnek belirli bir tahminin yanlılığı anlamına gelmez. Yanlılığa neden olabilir veya olmayabilir.
Michael R. Chernick

0

Anket örneklemesinde, oransal tahminin standart hatası gereklidir. J'den daha çok i'ye bağlıdır. Ayrıca açtığım oyların rastgele seçilmesini gerektirir. P, A adayı için gerçek nihai oransa, tahminin varyansı

(1ij)p(1p)i

(1ij)sonlu popülasyon düzeltme faktörü olarak adlandırılır. Bu varyansı tahmin etmek için, p için normal tahmin, formülde p yerine ikame edilir. Standart hata karekök alındığında elde edilir. Kazanan tahmin eden kişi, tahmin artı veya eksi 3 standart hata kullanabilir. Eğer aralıkta 0.5 bulunmazsa, 0.5 alt sınırın altındaysa A adayı kazanan ilan edilir veya 0.5 üst sınırın üstünde ise rakibi kazanan olarak ilan edilir. Tabii ki bu sadece 0.5'in aralığın dışında olması durumunda kazananın kim olacağını çok yüksek bir güvenle söylüyor. Kullandığınız şey üç standart hata ise güven seviyesi 0,99'dur (binomiye normal yaklaşıma dayanarak). 0,5 aralığın içindeyse, kimse kazanan ilan edilmez ve anketör daha fazla verinin birikmesini bekler.

Bir projeksiyon yaparken kirleticiler, sayılan oylara bakıldığında ortaya çıkabilecek olası önyargıları önlemek için birikmiş oylardan tabakalı rastgele bir örnek seçebilir. Tüm birikmiş oylara bakmadaki sorun, bazı bölgelerin diğerlerine göre tam sayılması ve nüfusun temsilcisi olmayabilir.

Makale burada sorun ve sayısız referanslar iyi bir kapsama alanı sağlar.

Biriken oyların oranlara ilişkin önyargılı tahminler sağlayabileceğine dikkat çekildi, çünkü henüz rapor etmemiş olan bölgeler, partiyi takip eden adayla destekleme eğilimi olan ya da devamsız oyların takip eden adayı destekleyeceği yönündedir. ve bu oylar en son sayılır. Harris ve Gallup gibi sofistike anketörler böyle tuzaklara düşmezler. Ana hatlarıyla koyduğum birikimli oylara dayalı güven aralıkları oluşturmanın basit analizi kullanılan tek faktördür. Bu anketörlerin elinde daha fazla bilgi bulunmaktadır. Seçimden kısa bir süre önce alınan anketler var ve son yıllarda seçimlerde alınan tüm bölge ve devamsız oyların oy verme biçimlerine sahipler.

Bu nedenle, yakın bir seçimi zıt yönde sallayabilecek net önyargılar varsa, kirleticiler bunu tanıyacak ve bir kazananı yansıtmayı engelleyecektir.

ABD'de devamsızlık oyları ağırlıklı olarak yurtdışındaki okulda bulunan askeri denizaşırı ülkelerden ve üniversite öğrencilerinden gelmektedir. Ordu daha muhafazakâr ve Cumhuriyetçi oy kullanma eğilimi gösterebilirken, meslektaş öğrenciler daha liberal ve Demokratik oy kullanma eğilimindedir. Tüm bu hususlar dikkate alınır.

Modern yoklamanın bakımı ve sofistike olması, 1936 Edebiyat Özeti anketi veya Chicago gazetesinin 1948 Dewey seçimlerinin erken imtiyazı gibi büyük hataların o zamandan beri gerçekleşmemesinin sebebidir.


2
Anket örnekleme ile örtük analoji uygun olsa da, bu soru karmaşık faktörler eklemiyor mu? Birincisi ikiden fazla adayın olasılığıdır. İkincisi, bu sıralı bir karar problemidir: tipik olarak bir anket boyutu belirten ve örneğe dayalı olarak bir karar veren anketörden farklı olarak, her anda ağın büyüyen bir örneği vardır ve seçimi çağırmaya veya beklemeye karar vermelidir daha fazla bilgi. Burada teklif ettiğiniz anket uygulamaları bu dinamik durum için geçerli görünmüyor. Ve ağ neden 3 SE kullanıyor? (Ünü tehlikede.)
whuber

1
@whuber Muhtemelen pratikte dikkate alınmayan komplikasyonlar olduğu konusunda hemfikirim. Basitlik için çoğunluğun kazanacağı iki aday davayı seçtim. Bence OP'nin aklında olan durum bu. Üç veya daha fazla adayla çoğulluk kazanmak, "kazanan adayın rakiplerinden daha yüksek bir orana sahip olduğunu göstermeyi içerir. Kesinlikle anketi birden fazla kez yaparsanız, örneklemenin sıralı doğası dikkate alınmalıdır. öyle.
Michael R. Chernick

1
3 SE seçimim, anketörlerin bir kazanan ilan etmeden hemen önce "çok emin" olmak istediklerini düşünüyorum. Bu nedenle 3'ün 2'nin üzerinde kullanılacağını düşünüyorum. Daha da küçük bir hata riski istiyorsanız 3'ten daha yüksek olabilirsiniz. OP'ye kesinlik düzeyinin i ve j basit bir şekilde. Durumu karmaşıklaştırmak sonucu daha karmaşık hale getirecek ve I ve j bağımlılığı açıkça görülmeyecektir.
Michael R. Chernick

2
n2

3
Birkaç downvotes aldığım için, biri bunun gerekçesini açıklayabilir mi?
Michael R. Chernick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.