Anketler:% 25 geniş bir kullanıcı tabanı temsilcisidir?


13

İşverenim şu anda ofise karşı tutumlar hakkında şirket çapında bir anket yürütüyor, yani Duygu. Geçmişte, anketi işletmenin tüm alanlarına açtılar (10 çok farklı departman varsayalım) ve bunların içindeki tüm çalışanlar (şirket genelinde toplam 1000 çalışan var) Her departmandaki çalışan sayısı eşit değildir ve bir belirli bir departman muhtemelen kuruluşların toplam nüfusunun% 50'sidir.

Bu yıl, anket toplam çalışan tabanının sadece% 25'ine açılıyor ve seçim 'rastgele'

Dolayısıyla, iki sorgum var:

  • Tüm çalışan tabanının gerçekten rastgele bir seçimi ise, tüm bu çalışanların yanıt verdiği varsayılarak istatistiksel olarak geçerli bir örnek nasıl olur?

  • Bölüm başına rastgele ise, örneğin her bölümün% 25'i, bir bölümü dikkate alan geçerli bir örnek, toplam nüfusun% 50'sinden fazladır.

Bir şirketteki çoğunluk hissini belirlemek için, gerçek bir okuma hissi sağlamak için her departmanda çalışan tabanının en az% 50'sine ihtiyaç duyacağımı varsayıyordum.

Güncelleme : Anket uygulanmıyor. Seçilen% 25'ten% 100 yanıt oranı garanti edilemez. Anket doldurulursa veya doldurulmazsa, teşvik edici veya cezalandırıcı bir yöntem yoktur.


2
Anketi olması gerektiği kadar küçük (soru sayısı / türü) yapmayı, daha sonra ihtiyaç duyduğunuz kadar zorunlu hale getirmenizi ve böylece çalışanların / yöneticilerin dev bir zaman emişinden şikayet etmemelerini öneririm. İnsanlar kendi seçtikleri takdirde, bu, bazı biçimlerin sistematik yanlılığını garanti eder.
Nick T

Eğer ölçüm yapıyorsanız, normal olarak dağıtılan bir değişkenin ortalamasını alırsanız, yaklaşık 20 yanıttan sonra +/- aralığınızın boyutu kabaca büyür 1/sqrt(# responses). Örneğin, 20 yanıtla sahip olacaksınız +/- .468 * sigma. 100 yanıt ile olacak +/- .198 * sigma. 1000 yanıt ile olacak +/- .062 * sigma.
Pace

Yanıtlar:


22

ABD genel nüfusunda yapılan anketleri düşünün. Çoğunluk fikrini belirlemek için nüfusun% 50'sine ihtiyacımız olursa, gerçekten yasaklayıcı olan yaklaşık 160 milyonluk bir örneğe ihtiyacımız olacaktır. % 1'lik bir örnek bile aşırıdır (yaklaşık 3,2 milyon) ve nadiren yapılır. ABD'de yapılan önemli bir araştırma Genel Sosyal Araştırma, 1.500 ila yaklaşık 3.000 arasında örnek büyüklüğüne sahiptir. Yani% 25'lik bir örnek kendi başına sorun değil.

Bir anketin bir seçim veya referandum olmadığını unutmayın. İkincisinin meşru olabilmesi için her uygun kişi söz hakkına sahip olmalıdır. Anket için amaç ortalama görüş hakkında iyi bir tahmin elde etmektir ve bunu rastgele bir örnekle alabilirsiniz. Bu yüzden şirketin anketin amacının ne olduğuna karar vermesi gerekiyor: çalışanların fikirlerini bildirmenin ve şirkete katılmasının bir yolu mu yoksa yöneticilerin bilgi almasının bir yolu mu?

Her iki örnekleme tasarımı da çalışanların% 25'inin sorulmasını sağlar. İkincisi, ankette daha küçük bölümlerin temsil edilmesini sağlar. Standart hataları önemsiyorsanız, bu örneklemin iç içe doğasını dikkate almalısınız, ancak bu durumda çok önemli olacağından şüphelenmiyorum.


2
+1 ancak "ortalama görüş" ile ilgilenmiyorsanız, ancak başka bir şey daha büyük örneklerin gerekli olabileceğini vurgulamakta fayda var.
Tim

1
Cevap için teşekkür ederim. Ancak, bu benim ihmalim oldu, anketin uygulanması yok. Sadece% 25'i istenecek, ancak cevap vermek zorunda değiller.
Colin

2
Bu da normal. Bir anketi hazırlarsam insanları da cevaplamaya zorlamak zor olacaktır. Yanıtlayanlarımı "ikna etmek" için bazı haydutlar kiralamaya çalışabilirim, ancak bunun etik ve yasal sonuçları olacaktır ... Daha azı, yanıt vermeme bir konudur, ancak çoğu anketin uğraşması gereken bir konudur.
Maarten Buis

7

Etimoloji ile " anket " ( sur-"süper" den, "yukarıdan" ve -vey"görünüm" den) tam resmi değil, genel bir bakış elde etmek anlamına gelir .

% 25 gerçekten rastgele olduğu ve yani kendi kendine seçildiği (katılmadığı sürece), terimin tanımına oldukça uygundur. Anket isteğe bağlıysa, cevaplar yalnızca cevaplamaya ihtiyaç duyanları temsil edecektir. Örneğin, yemek yedikten sonra bir geri bildirim kartı doldurabileceğiniz bir restoran düşünün. Çoğu restoran mutlu olsa bile, geri bildirimlerin çoğu olumsuz olacaktır çünkü mutlu müşteriler geri bildirim vermek için çok az neden görmektedir.


1
'Kendini seçme' nin etkisini genişletebilir misiniz? Bu anket uygulanmaz, tamamen isteğe bağlıdır ve doldurur veya doldurmazsanız herhangi bir teşvik edici veya cezalandırıcı araç yoktur. Açılış sorumu güncelleyeceğim.
Colin

6
@Colin: Anket isteğe bağlıysa, cevaplar yalnızca cevaplamaya ihtiyaç duyanları temsil edecektir. Örneğin, yemek yedikten sonra bir geri bildirim kartı doldurabileceğiniz bir restoran düşünün. Çoğu restoran mutlu olsa bile, geri bildirimlerin çoğu olumsuz olacaktır çünkü mutlu müşteriler geri bildirim vermek için çok az neden görmektedir.
dotancohen

1
@dotancohen Bence cevap, bu yorumun içinde yer almasından çok fayda sağlayacaktır.
Pere

@Pere: Teşekkürler, yorumu cevabın içine koymanın etimolojik noktadan uzaklaşabileceğinden endişelendim. Ama haklısın ve ekliyorum.
dotancohen

4

Başka bir bakış açısı deney tasarımı teorisinden gelir.

İstatistiksel güç, eğer gerçekse bir etki bulma olasılığıdır ( kaynak )

Dört faktör gücü etkiler:

  1. Etkinin boyutu
  2. Karakteristik standart sapma
  3. Daha büyük örnek boyutu
  4. İstenen önem düzeyi

Bu öğelere dayanarak, güç, örnek boyutu, efekt boyutu, standart sapma ve önem seviyesi ( kaynak ) ile ilgili resmi bir matematiksel denklem yazabilirsiniz.

Bir dizi varsayım altında , anketinizi bir deneme olarak karakterize edebilir ve deney çerçevesinin tasarımına dokunabilirsiniz ( burada birkaç örnek vardır). Yapılması gereken bir dizi eğitimli tahmin vardır; ancak, kusurlu bir model hiçbir modelden daha iyi olmayabilir.


3

İki soru hissediyorum. Biri örneklem büyüklüğü hakkında (% 25, ​​neden çoğunluk değil) ve diğeri örnekleme tekniği hakkında (gerçekten rasgele, tüm şirkette rastgele% 25 örnek, her departmanda rastgele% 25 örnek veya başka bir dağıtım kullanıyor).

1) Numune boyutunun çoğunluk olması gerekmez. Gerekli örnek büyüklüğü, belirli bir güven veya olabilirlik oranı için gereken doğruluğa bağlı olarak% 0 ile% 100 arasında herhangi bir şey olabilir.

Asla% 100 kesinlik elde edilmez (% 50 veya daha büyük bir alt kümede de yoktur). Bu kadar yüksek bir doğruluk elde etmek de örnekleme ve tahmin etme noktası değildir.

Örnek boyutları hakkında daha fazla bilgi edinin: https://en.wikipedia.org/wiki/Sample_size_determination

Çok sayıda yasa alırsanız, sezgisel bir fikriniz de olabilir.

Tüm olası altkümelerin ortalamalarının dağılımı (ve numuneniz bunlardan biri olacaktır), alt kümenin boyutu artarsa, daha küçük ve orijinal dağılımın ortalamasına yaklaşacaktır. Bir kişiyi seçerseniz, bir istisna bulmanızın makul bir şansı vardır, ancak aynı istisnayı aynı yönde iki kez bulmak daha az olası hale gelir. Ve böylece, örneklenen alt kümenin boyutu ne kadar büyük olursa, istisnai bir alt kümenin şansı o kadar küçük olur.

En sonunda tüm olası alt-ortalamalarının dağılımı bölü ilk kümesinin varyans eşit bir varyansa sahip alt kümesinin boyutu.n

Önemli Not! Tahmininiz, örneklediğiniz popülasyonun büyüklüğüne değil , o popülasyonun dağılımına bağlı olacaktır.

500 ebat departmanınız için. Rastgele altkümelerin (125 büyüklüğündeki) ortalamalarının sapması, orijinal sapmadan 11 kat daha küçük olacaktır. Ölçümdeki hatanın (rastgele seçilen alt kümelerin ortalamasının sapması), bölümün boyutundan bağımsız olduğunu unutmayın. 500, 5000 veya 50000 olabilir, her durumda tahmin, aynı dağılıma sahip oldukları sürece etkilenmeyecektir (şimdi küçük bir departmanın garip bir dağılımı olabilir, ancak bu daha büyük gruplar için kaybolmaya başlar).

2) Örneklemenin tamamen rastgele olması gerekmez . Demografiyi hesaba katabilirsiniz.

Sonunda, her bir departmana bu tür analizlerde ayrı ayrı davranırsınız ve departmanlar arasındaki farklılıklar ve bu farklı boyutlardaki departmanlardan nasıl örnek aldığınızı düzeltirsiniz.

Bu düzeltmede iki önemli ayrım vardır. Gruplar arasındaki dağılımı rastgele değişken olarak kabul edip edemeyiz. Rastgele bir değişken olarak ele alırsanız, analiz daha güçlü hale gelir (modelde bir miktar serbestlik derecesi alarak), ancak farklı gruplar belirli bir etkisi olmayan rastgele varlıklar olarak değiştirilemezse (ki öyle görünmektedir) sizin durumunuz, bölümlerin farklı işlevlere sahip olduğunu ve bölümle ilişkili olarak rastgele olmayan çok farklı duygulara sahip olabileceğini hayal ettiğimden).


1
Cevap için teşekkür ederim. Ancak, bu benim ihmalim oldu, anketin uygulanması yok. Sadece% 25'i istenecek, ancak cevap vermek zorunda değiller.
Colin

1
Ardından, örnekleme teknikleri ve verilerin nasıl toplandığı hakkında ek bir üçüncü soru daha var. Bu tür sorunlar için, yanıtsızlık ve verilerin diğer kalite yönleriyle nasıl baş edileceği konusunda tek bir cevap yoktur. Her durumda (ya% 50 ya da% 25'i sorarak) yanıtta büyük bir sorun olup olmadığı istatistiksel analizle ilgili herhangi bir tartışma sadece ikincil öneme sahiptir. Daha fazla (örn.>% 50) örnekleme ile bu çalışmayı fazla geliştirmeyeceksiniz ve iyi örneklemeye odaklanmak daha iyidir .
Sextus Empiricus

2

Sorunuz sınırlı bir popülasyon için örneklem büyüklüğü ile ilgili. Ancak ihtiyacınız olan ilk şey, sonsuz bir popülasyonda gerekli olan örneklem büyüklüğüdür; bu daha sonra sonlu bir popülasyon için örneklem büyüklüğünü hesaplamak için kullanılabilir.

Sonsuz bir popülasyonda yapılan bir ankette formül: , örnek boyutu , güven seviyesi, genellikle 1.96 , karakteristik olan popülasyonun oranı, bilinmiyorsa 0.5 , karakteristik olmayan popülasyon oranı , hata seviyesi (hata payı olarak da bilinir), genellikle% 3, ancak% 1 veya% 5 kullanılabilir.n=(z2pq)/d2
n
z2
p
q=1p
d2

Hata seviyesi en önemli faktör haline gelir, çünkü hata seviyesi ne kadar düşükse, gerekli olan numune boyutu da o kadar büyük olur ve bunun tersi de geçerlidir. Bu nedenle,% 3 hata ile sonsuz bir popülasyon için örneklem büyüklüğü: . Ayrıca hata seviyesi, sonuçların bu durumda +/-% 3'lük bir hataya sahip olduğu anlamına gelir. Bu, anketteki kişilerin% 48'inin erkek olması durumunda, mümkün olan aralığın% 48 +/-% 3 veya% 45 ila% 51 olduğu anlamına gelir.(1.96×0.5×0.5)/0.032=1,068

Bir sonraki adım, sonlu bir popülasyon için numune boyutu formülüdür: , sonlu popülasyon için numune boyutu , sonsuz popülasyon için numune boyutu (yukarıdan 1,068) , sonlu nüfus büyüklüğüm=n/(1+((n1)/N))
m
n
N

Örnek kullanarak ,% 3 hata ile gerekli örnek boyutu olacaktır ya da nüfusun% 51.7.1068 / ( 1 + ( ( 1068 - 1 ) / 1000 ) ) = 517N=1,0001068/(1+((10681)/1000))=517

Nüfusun% 25'ini kullandıysanız, hata seviyesi% 5.4 olarak çıkıyor. Bu hata seviyesi önceki anketlere dayanarak iyi olabilir. Anketlerde, her zaman kabul etmek istediğiniz hata düzeyi ile anketi yapmanın maliyeti arasında bir denge vardır.

Yanıt oranındaki bu faktörlerin hiçbiri (basit bir rastgele örnek kullanılıyorsa). Kaç kişinin iletişim kurması gerektiğini bulmak için, örneklem büyüklüğünü beklenen yanıt oranına böldünüz. Örneğin, önceki yanıt oranı% 65 ise, anket aracını kişiye göndermeniz gerekir .517/0.65=796

Eğer nüfusu bölümlere ayırmak istiyorsanız (tabakalaşma olarak bilinir) işler daha karmaşık hale gelir. Temel olarak, verilerin her departman için doğru olmasını istiyorsanız, her bir departmanı ayrı bir sonlu popülasyon olarak ele almanız gerekir, ki bu pratik olmayabilir. Ancak, örneklemin% 50'sinin nüfusun% 50'sinin bulunduğu bölümden rastgele seçildiği ve uygun yüzdelerin diğer bölümlerden rastgele örneklendiği basit bir rastgele örnek yerine katmanlı bir rastgele örnek yapabilirsiniz. Bu, örnek büyüklüğünüzün biraz artacağı anlamına gelir çünkü tüm ondalık basamakları yuvarlamanız gerekir (bir kişinin 0.1'ini araştıramazsınız). Ancak, sonuçlar bölüm düzeyinde değil, nüfus (şirket) düzeyinde incelenmelidir, çünkü her bir departmanın doğru olması için yeterli cevap olmayacaktır.


1

Geçerli bir örnek hakkında konuşurken, altta yatan fikir genellikle temsilidir. Örneklem popülasyonu "temsil ediyor" mu? Temsili bir örnek elde etmek için, örnek büyüklüğünün yeterli olduğundan (tahminin varyansını azaltmak için) ve örneğin farklı davranış türleri sergileyen popülasyonun alt kümelerine ait üyeler içerdiğinden emin olunmalıdır. dikkate alınmaktadır.

İlk olarak, anket için seçilen kullanıcıların oranı, seçilen mutlak kullanıcı sayısına göre daha az önemlidir. Gereken örneklem büyüklüğü verilen cevaptaki doğruluk veya güven aralığına bağlı olacaktır. Daha fazla bilgi için bu makaleyi okuyabilirsiniz .

Şirketin birkaç departmandan oluştuğunu belirtiyorsunuz. Departmanların ankete verdikleri cevaplarda farklılık göstermesi muhtemel mi? Eğer yaparlarsa (ya da belki de kesin olarak bilmiyorsanız), örneğinizi departmanlar arasında “katmanlaştırmak” iyi bir fikir olacaktır. En basit şekliyle, bu, her departmandan eşit oranda insan seçmek anlamına gelir. Örn: Şirket büyüklüğü 1000'dir ve seçilen örnek büyüklüğü 100'dür. Sonra, 500 büyüklüğündeki bir departmandan 50, 100 büyüklüğündeki bir departmandan 10, vb. herhangi bir spesifik "rastgele" örnek.

Ayrıca, ankete herkesin cevap veremeyeceğini de belirtiyorsunuz. İnsanların yaklaşık yarısının yanıt vereceğini biliyorsanız, 100 yanıt almak için anketi 200 kişiye göndermeniz gerekecektir. Bu tür yanıtların önyargılı olma olasılığını düşünmeniz gerekecektir. Belirli bir yanıtı olan insanlar cevap vermeye daha az ya da çok eğilimli olabilirler.


1

Tüm çalışan tabanının gerçekten rastgele bir seçimi ise, tüm bu çalışanların yanıt verdiği varsayılarak istatistiksel olarak geçerli bir örnek nasıl olur?

Anlatmak istediği popülasyondan alındığı sürece geçerli bir örnektir. Yani, sadece patronları örneklerseniz, diğer çalışanlar hakkında hiçbir şey söylenemez; tanımladığınız ayarda gerçekleşmez. Bununla birlikte, yanıt vermemesinden dolayı olabilir (daha fazla bilgi aşağıda).

Bölüm başına rastgele ise, örneğin her bölümün% 25'i, bir bölümü dikkate alan geçerli bir örnek, toplam nüfusun% 50'sinden fazladır.

Bu artık örnek geçerliliği değil, örnekleme hatasıdır. Açıkçası, en kesin tahminler tabakalı rastgele çekilişten, en azından bölüm seviyesini kapsayan tabakadan elde edilecektir. Böyle bir ortamda, her departman için geçerli bir numuneye sahip olacaksınız, ancak küçük departmanlar için tahminler, ikincisi için daha yüksek mutlak numune boyutu sayesinde, büyük departmanlar için tahminlerden genellikle daha az kesin olacaktır. Genel organizasyon için, daha büyük departmanların daha yüksek örnek temsili, sadece organizasyonun gerçekliğini yansıtır ve hiçbir şekilde numunenin geçerliliğini azaltmaz.

Anket uygulanmıyor. Seçilen% 25'ten% 100 yanıt oranı garanti edilemez. Anket doldurulursa veya doldurulmazsa, teşvik edici veya cezalandırıcı bir yöntem yoktur.

Hiç kimseyi iyi bir yanıt vermeye zorlayamazsınız, ancak bir yanıt hatırlatma planı uygulamak minimumdur. Ayrıca, anketin çalışanlarla ilgisini ve anket sayesinde organizasyon üzerindeki etkilerini açıklamalısınız: örneğin sonuçlar ne zaman yayınlanır? kuruluşun ankete dayanarak gerçekleştirdiği potansiyel eylemler nelerdir? her cevap neden önemlidir?

Veriler toplandıktan sonra yanıt verilmemesi, ele alınması gereken bir konudur. Bununla başa çıkmak, herhangi bir potansiyel paterni tespit etmek için ilk olarak yanıt vermeyen davranışı analiz etmeniz gerektiği anlamına gelir: patron yanıt vermedi mi? Belirli bir departman hiç cevap vermedi mi? Sonra gerekli stratejiyi (post-strafification, reweighting, imputation, vb.) Benimseyin.


1

Bu dört faktörün nasıl önemli olduğuna dair bir örnekle @ICannotFixBu sorunun cevabını genişletiyorum:

  1. Etkinin boyutu
  2. Karakteristik standart sapma
  3. Daha büyük örnek boyutu
  4. İstenen önem düzeyi

Bu faktörlerin sonuçlarınızı nasıl etkilediği, kullandığınız istatistiğe bağlı olacaktır. Örneğin, bazı değişkenlerin ortalamasını tahmin etmek isterseniz Student's T Testini kullanabilirsiniz .

Bu anketle çalışanlarınızın ortalama yüksekliğini bulmak istediğinizi varsayalım. Aslında, şirketinizdeki tüm çalışanların yüksekliğinin standart sapmasını bilmiyorsunuz (herkesi ölçmeden), ancak 3 inçte biraz araştırma yapabilir ve tahmin edebilirsiniz (ABD'deki erkekler için kabaca standart yükseklik sapmasıdır).

Yalnızca 5 kişiyi araştırdıysanız, anketinizde gözlemlediğiniz ortalama yüksekliğin% 95'i gerçek ortalama yüksekliğin 3,72 inç'i içinde olacaktır.

Şimdi, faktörlerimiz bunu nasıl etkiler:

  1. Ortalama yüksekliği çok hassas bir şekilde bilmeniz gerekiyorsa (örneğin, etki boyutu çok küçüktür), çok sayıda örneğe ihtiyacınız olacaktır. Örneğin, 2,66 inç içindeki gerçek ortalama yüksekliği bilmek için 100 kişiyi araştırmanız gerekir.

  2. Standart sapma büyükse elde edebileceğiniz hassasiyet sınırlı olacaktır. Standart sapma 3 inç yerine 6 inç olsaydı ve hala 5 yanıtınız olsaydı, gerçek ortalama yüksekliği 3.72 inç yerine sadece 7.44 inç içinde bilirsiniz.

  3. Tartışmanın odağı olduğu için bu noktayı atlamak.

  4. Doğru cevaba sahip olduğunuzdan gerçekten emin olmanız gerekiyorsa, daha fazla kişiyi araştırmanız gerekir. Örneğimizde, 5 yanıtla zamanın% 95'inde 3.72 inç içinde olabileceğimizi gördük. Cevabımızın% 99'unun doğru aralıkta olduğundan emin olmak istersek, aralığımız 3.72 inç değil 6.17 inç olacaktır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.