Nüfus varyansını hesaplamada N ve N-1 arasındaki fark nedir?


50

Neden olduğunu Nve N-1popülasyon varyansını hesaplarken anlamadım . Ne zaman Nve ne zaman kullanıyoruz N-1?

görüntü tanımını buraya girin
Daha büyük bir sürüm için buraya tıklayın

Nüfusun çok büyük olması durumunda N ve N-1 arasında bir fark olmadığını ancak başlangıçta neden N-1 olduğunu söylemediğini söylüyor.

Düzenleme: Lütfen tahmin etmekte kullanılan nve kime karıştırmayın n-1.

Düzen2: Nüfus tahmini hakkında konuşmuyorum.


5
Orada bir cevap bulabilirsiniz: stats.stackexchange.com/questions/16008/… . Ne zaman Temel olarak, N-1 kullanmalıdır tahmin Ne zaman bir varyansı, ve N hesaplamak tam olarak.
ocram

@ocram, bildiğim kadarıyla varyansı tahmin ettiğimizde n ya da n-1'i kullanıyoruz.
ilhan

Tahmin edicinizin tarafsız olmasını istiyorsanız, n-1'i kullanmalısınız. N büyük olduğunda bunun bir sorun olmadığını unutmayın.
ocram

2
N1N11/Ny
StasK

2
Bu gerçekten diğer cevaplara eklenmez. Farklı bölenlerin farklı cevaplar verdikleri ya da farkın N ile azaldığı bile sorun değil. Soru, her iki bölenin ne zaman ve neden kullanılması gerektiğidir.
Nick Cox,

Yanıtlar:


26

Nn(N1)/N=1(1/N)12/N117/Nexp(1/N)

(n1)/nn11/N

NN

NN1NNn


24

Matematiğe girmek yerine onu düz kelimelerle anlatmaya çalışacağım. Bütün nüfusu emrinde ise, varyansı ( nüfus farkı ) payda ile hesaplanır N. Aynı şekilde, eğer sadece numuneniz varsa ve bu numunenin varyansını hesaplamak istiyorsanız , paydayı kullanın N(bu durumda numunenin n'si). Her iki durumda da, hiçbir şey tahmin edemezsiniz : ölçtüğünüz ortalama, gerçek ortalamadır ve bu ortalamadan hesapladığınız değişken, gerçek sapmadır.

Şimdi, sadece örneklem var ve popülasyondaki bilinmeyen ortalama ve varyans hakkında çıkarım yapmak istiyorsunuz. Başka bir deyişle, tahminler istiyorsun . Örnek ortalamanızı popülasyon ortalamasının tahmini için alırsınız (çünkü örneğinizin temsilcisi ise). Nüfus varyansı tahmininin elde edilmesi için, bu ortalamanın gerçekten popülasyon ortalaması olduğunu ve bu nedenle hesapladığınızdan bu yana örneğinize bağlı olmadığını iddia etmeniz gerekir. Şimdi bunu sabit olarak aldığınızı "göstermek" için, numunenizden bir (herhangi bir) gözlemi, ortalamanın değerini "desteklemek" için ayırırsınız: numuneniz her ne olduysa, bir ayrılmış gözlem her zaman sizin için olan değeri getirebilir. var ve hangisinin örnekleme olasılıklarına duyarsız olduğuna inanıyorum. Ayrılmış bir gözlem "-1"N-1 hesaplama varyansı tahmininde.

Gerçek popülasyonun ne anlama geldiğini bildiğinizi, ancak örneklemden sapmayı tahmin etmek istediğinizi hayal edin. Daha sonra, bu gerçek ortalamayı varyans formülüne yerleştirir ve paydayı uygularsınız N: burada gerçek ortalamayı bildiğiniz için burada "-1" gerekmez , bu aynı örnekten tahmin etmediniz.


Ancak sorumun tahminle ilgisi yok. Bu, nüfus varyansını hesaplamakla ilgilidir; N ve N-1 ile. N ve n-1 hakkında konuşmuyorum.
ilhan

1
@ ilhan, cevabımda Nhem N hem de n için kullandım . Npopülasyon veya numune olarak eldeki bir toplamın bir büyüklüğüdür. Nüfus varyansını hesaplamak için emrinizde nüfus olması gerekir . Yalnızca örneğiniz varsa, bu örneğin varyansını hesaplayabilir veya popülasyon tahmini varyansını hesaplayabilirsiniz . Başka yol yok.
ttnphns

Nüfusum hakkında tam bir bilgim var; tüm değerler biliyor. Tahminde bulunmak istemiyorum.
ilhan

1
Nüfusunuz varsa o zaman N kullanın. N-1 kullanmak mantıksızdır.
ttnphns

1
@ilhan - Yorumunuzu doğrudan ttnphns yayınına yorumlayamadı, ancak işte kitapta gördüklerinizin ve nasıl çıkarmanız gerektiğinin bir açıklaması. Varyansı belirtmek için kullanıldığında 'S' sembolü daima numune varyansını belirtir. Yunan mektubu sigma popülasyon varyansını belirtmek için kullanılır. Kitabın S = N * sigma / (N - 1)
Arvind

9

Genel olarak, popülasyonun sadece bir kısmı, yani bir örneklem varsa, n-1'e bölmelisiniz. Bunu yapmak için iyi bir neden var, biliyoruz ki, ortalama kareler sapmalarını örnek ortalamasından (n − 1) / n ile çarpan örnek sapma, popülasyon varyansının yansız bir tahmincisidir.

Örneklem varyansının tahmin edicisinin burada tarafsız olduğuna dair bir kanıt bulabilirsiniz: https://economictheoryblog.com/2012/06/28/latexlatexs2/

Ayrıca, eğer biri popülasyon varyansının tahmin edicisini uygulayacak olsaydı, bu, popülasyon yerine bir örneklemde n'ye bölünen varyans tahmincisinin versiyonudur, elde edilen tahmin yanlı olacaktır.


Bu, nüfus varyansını tahmin etme konusunda farklı bir soruya cevap veriyor gibi görünmektedir. Dairesel görünüyor: Bu cevap, ilk olarak nüfus varyansını tanımlamak için belirli bir sözleşmeyi varsaymaya dayanmıyor mu?
whuber

7

Geçmişte, çıkarımsal olmayan bir varyans için N kullanmanız gerektiğine dair bir argüman vardı, ama artık bunu tavsiye etmem. Her zaman N-1'i kullanmalısın. Numune büyüklüğü azaldıkça, N-1, numune varyansının azalması gerçeği için oldukça iyi bir düzeltmedir (dağılımın zirvesine yakın numuneyi örneklemeniz daha muhtemeldir - bkz. Şekil). Örneklem büyüklüğü gerçekten büyükse, anlamlı bir önemi yoktur.

Alternatif bir açıklama, nüfusun ulaşılması imkansız olan teorik bir yapı olduğudur. Bu nedenle, daima N-1'i kullanın, çünkü ne yaparsanız yapın, en iyi ihtimalle popülasyon varyansını tahmin ediyorsunuz.

Ayrıca, buradan itibaren varyans tahminleri için N-1'i göreceksiniz. Öğretmeninizden bir çıkarımsal arasında bir ayırım yapmanızı isteyebilecekleri bir sınav dışında muhtemelen bu konuyla hiç karşılaşmayacaksınız. çıkarımsal olmayan varyans ölçümü. Bu durumda, whuber'un cevabını ya da benimkini kullanmayın, ttnphns'ın cevabına bakın.

Şekil 1

Bu şekilde, varyansın 1'e yakın olması gerektiğine dikkat edin. Varyansı tahmin etmek için N kullandığınızda örnek büyüklüğüne ne kadar değiştiğine bakın. (bu, başka bir yerde adı geçen "önyargı" dır)


1
Lütfen, bana neden N 'nin artık tavsiye edilmediğini' gerçek popülasyonda olduğunu söyle? Nüfus her zaman teorik bir yapı değildir. Bazen numuneniz sizin için iyi niyetli bir popülasyondur.
ttnphns

1
ilhan, N numuneniz için kullanılabilir veya eğer varsa nüfus büyüklüğü için kullanılabilir. Çoğu durumda, büyük N ve küçük n arasındaki ayrım konuya bağlıdır. Örneğin, n, bir denemedeki her koşuldaki vaka sayısı, N ise deneme için sayı olabilir. İkisi de örnek. Global bir kural yok.
John

1
ttnphns, nüfus derken ne demek istediğine bağlı. Nüfusunuzun tamamı o kadar küçükse N-1’in önemi varsa o zaman ortalama bir kare sapmanın hesaplanmasının hiç de uzaktan faydalı olup olmadığı şüphelidir. Tüm değerleri, şekillerini ve aralıklarını göster. Ayrıca, bir çıkarım yapmazsanız, aslında N serbestlik derecesine sahip olduğunuz eski argümanları sorgulanabilir. Ortalamayı hesapladığınızda varyansı hesaplamanız için bir tane kaybettiniz.
John

1
Eğer nüfus içindeki demek hesaplamak eğer @John, sadece devlet parametresi hakkında gerçeği, yani özgürlük hiçbir derecelerini geçirirler. Eğer numunede bunu hesaplamak ve isterseniz çıkarımda nüfusu hakkında, o zaman bir tane harcıyorlar. Ayrıca N = 1 olan bir popülasyona sahip olabilirim. Payda, N-1 ile, varyans gibi parametre olmadığını appeares ana kadar bunun için. Bu saçmalık.
ttnphns

3
@ilhan Lütfen, sorunuzu (yaptığınız gibi) güncellemeyi düşünün ve bu tür yapıcı olmayan yorumlar bırakmak yerine güncellenmiş sürümü işaret edin. Her şey tartışmalı, özellikle de sorunun kendisi bağlamdan yoksun. Burada problem nüfusun gerçekte ne olduğunu tanımlamaktan kaynaklanıyor gibi görünüyor.
chl

4

Popülasyon varyansı, popülasyondaki tüm değerlerin kare sapmalarının toplamıdır ve popülasyondaki değerlerin sayısına bölünür. Bununla birlikte, bir popülasyonun bir örneklemden varyansını tahmin ederken, örnek değerlerin örnek ortalamasından sapmalarının ortalama olarak bu örnek değerlerin ortalamadaki sapmalardan biraz daha az olması sorunuyla karşı karşıyayız. bilinmiyor) gerçek nüfus ortalaması. Bu, örneklemden hesaplanan bir varyansın gerçek popülasyon varyansından biraz daha az olmasıyla sonuçlanır. N yerine n-1 böleni kullanılması, bu hafife almayı düzeltir.


@ Bunnenburg, sorunuza cevap alırsanız. Lütfen şimdi bana açıkla, neyin var? Bu benim için de büyük bir karışıklık.
Bilal Para

Elimizdeki az farkın karşılığını telafi etmek için neden n-2, n-3 kullanmıyoruz? özellikle n-1 neden? neden sürekli değil ... ???
Saravanabalagi Ramachandran

@ SaravanabalagiRamachandran Tutarsızlık örneklem büyüklüğüne göre değişir ve bu yüzden bir sabit hizmet vermeyecektir. N-1 kullanarak yapılan düzeltme, bahsettiğinizden daha iyi sonuç verir.
Michael Lew
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.