Standart sapma hesaplanırken


136

Eğer kare hatasının toplamı bölmek neden sınıfta bugün istendi yerine ilen-1n , standart sapmasını hesaplamak.

Sınıfta cevap vermeyeceğimi söyledim (tarafsız tahmin edicilere gitmek istemediğimden beri), ancak daha sonra merak ettim - bunun için sezgisel bir açıklaması var mı ?!


29
Bu zinger'i Sayısal Yemek Tarifleri kitabından alıntılamak isterim : "... ve arasındaki fark sizin için önemliyse, muhtemelen yine de hiçbir işe yaramazsınız - örneğin, şüpheli bir hipotezi kanıtlamaya çalışmak marjinal verilerle. " n - 1nn-1
JM, istatistikçi değil

11
Gerçekten zarif, sezgisel açıklama (ispat altında) burada sunulmuştur en.wikipedia.org/wiki/... temel fikir Gözlemleriniz nüfus demek daha demek numuneye yakın olacak, doğal olarak, olmalarıdır.
WetlabStudent

12
@Tal, Bu yüzden okullar emiyor. Onlara "neden böyle soruyorsun? ?" Ve onlar "sadece ezberlemek" cevap.
Pacerier

1
Sezgisel bir açıklama arıyorsanız, neden gerçekten örnek alarak kendinizin nedenini görmelisiniz! Bunu izle, bu soruya kesin cevap veriyor. youtube.com/watch?v=xslIhnquFoE
Sahil Chaudhary

tl; dr: (en iyi yanıtdan :) "... örneklem ortalamasından sapmalar kullanılarak hesaplanan standart sapma, popülasyonun istenen standart sapmasını hafife alıyor ..." Ayrıca bakınız: en.wikipedia.org/wiki/… Bu yüzden, biraz karmaşık bir şey hesaplamak istemiyorsanız, bir örnekten ise n-1 kullanın.
Andrew

Yanıtlar:


99

Bir bölen hesaplanan standart sapması numunenin alındığı nüfusun standart sapma bir tahmini olarak örnek hesaplanan bir standart sapmadır. Gözlenen değerler ortalama olarak, popülasyon ortalamasına göre örnek ortalamasına yaklaştığından, numune ortalamasından sapmalar kullanılarak hesaplanan standart sapma popülasyonun istenen standart sapmasını hafife alır. N kullanarakn1 yerine nn1n bölen olarak sonuç verme biraz daha büyük uygulayarak bunun düzeltir.

Düzeltme, büyük olduğu zamanki kadar küçük olduğunda daha büyük bir orantılı etkiye sahip olduğuna dikkat edin , bu bizim istediğimiz şeydir çünkü n'nin daha büyük olması durumunda, örnek ortalamanın popülasyon ortalamasının iyi bir tahmincisi olması muhtemeldir.n

Numune bütün nüfus olduğunda biz standart sapma kullanmak örnek demek çünkü bölen olarak ise nüfus demek.n

(Ben parantez içinde "bilinen, kesin bir ortalama etrafında ikinci bir an" ile başlayan hiçbir şeyin "sorgunun sezgisel bir açıklama talebini yerine getirmeyeceğini" not ediyorum.)


13
"Sezgisel" i "teknik olmayan" ile karıştırmayalım.
whuber

32
@Michael, Bu açıklamıyor Neden (veya hatta ) n−1yerine kullanıyoruz ? n−2n−3
Pacerier

1
@Pacerier Bu noktadaki ayrıntı için Whuber'un cevabına bir göz atın. Temelde, düzeltme n-2 yerine n-1'dir, çünkü n-1 düzeltmesi ihtiyaç duyduğumuz şeye çok yakın sonuçlar verir. Daha kesin düzeltmeler burada gösterilmektedir: en.wikipedia.org/wiki/Unbiased_estimation_of_standard_deviation
Michael Lew

1
Merhaba, Michael, öyleyse neden örnek ortalamasından hesaplanan sapma popülasyon ortalamasından daha küçük olma eğilimindedir?
Allen

1
“Gözlenen değerler ortalama olarak, popülasyon ortalamasına göre örnek ortalamasına yaklaştığından, ortalama örnekden sapmalar kullanılarak hesaplanan standart sapma, popülasyonun istenen standart sapmasını hafife alır.” Örnek ortalama neden her zaman hafife alıyor? Ya fazla tahmin ederse?
Bora M. Alper

55

Yaygın olanı, varyans tanımının (bir dağılımın) bilinen, kesin bir ortalama etrafında sabitlenen ikinci an olduğu, tahmin edicinin tahmini bir ortalama kullandığıdır . Bu bir serbestlik derecesi kaybı (ortalama verildiğinde veri kümesini veri değerlerini sadece bilgisiyle yeniden oluşturabilirsiniz ) sonucu "ayarlamak" için n yerine n - 1 kullanımını gerektirir .n1n1n

Böyle bir açıklama ANOVA'daki tahmini varyanslarla ve varyans bileşenleri analiziyle tutarlıdır. Bu gerçekten sadece özel bir durum.

Varyansı etkileyen bazı ayarlamaların yapılması gerekliliği , sanırım, sadece el sallama sonrası eski olan geçerli bir argümanla sezgisel bir şekilde açıklanabilir . (Öğrenci'nin 1908 tarihli t-testi makalesinde böyle bir tartışma yapmış olabileceğini hatırlıyorum.) Varyansa uyum ayarının tam olarak faktörü olmasının neden haklı olduğunu özellikle zordur. düzeltilmiş SD'nin tarafsız bir tahmin edici olduğu. (Sadece varyansın tarafsız bir tahmincisinin kareköküdür. Genellikle tarafsız olmak, doğrusal olmayan bir dönüşüme dayanamaz.) Yani, aslında, önyargılarını gidermek için SD’ye yapılan doğru ayarlaman/(n1) değildeğil bir faktör hiç!n/(n1)

Bazı giriş ders kitapları bile ayarlanmış olan sd'nin tanıtılmasını zahmet etmiyor: bir formül öğretiyorlar (bölü ). İlk önce böyle bir kitaptan ders verirken olumsuz tepki verdim, ancak bilgeliği takdir ederek büyüdüm: kavramlara ve uygulamalara odaklanmak için, yazarlar tüm gerekli matematiksel güzellikleri çıkarırlar. Hiçbir şeyin zarar görmediği ve kimsenin yanlış yönlendirilmediği ortaya çıktı.n


1
Teşekkürler Whuber. Öğrencilere n-1 düzeltmesi öğretmeliyim, bu yüzden yalnız n'ye bölmek bir seçenek değil. Benden önce yazıldığı gibi, ikinci anla olan bağlantıdan bahsetmek bir seçenek değildir. Her ne kadar ortalamanın zaten tahmin edildiğinden bahsetmemize rağmen, sd için bizi daha az "veri" bırakarak bu önemli. Sd'nin önyargısına gelince - onunla karşılaştığımı hatırladım - o noktayı eve bıraktığın için teşekkürler. En iyi, Tal
Tal Galili

3
@Tal Dilinde yazıyordum, öğrencilerininkine değil, çünkü onlara ulaşacağını bildiğin her şeye çevirebildiğine eminim. Diğer bir deyişle, ben sezgisel demek için söz konusu "sezgisel" yorumlanır size .
whuber

1
Merhaba Whuber. Güven oyu için teşekkür ederim :). Beklentinin tahmini için serbestlik derecesinin kaybolması, sınıfta kullanmayı düşündüğümden biri. Sorun şu ki, "serbestlik dereceleri" kavramının kendi başına bilgi / sezgiye ihtiyacı var. Ancak, bu başlıkta verilen diğer cevapların bazıları ile birleştirmek yararlı olacaktır (benim için ve gelecekte diğerleri umarım). En iyi, Tal
Tal Galili

Büyük , n veya n - 1'e bölmek arasında genellikle fazla bir fark yoktur , bu nedenle büyük numunelere uygulanması amaçlanmışsa düzeltilmemiş formülü vermek kabul edilebilir, değil mi? nnn1
PatrickT 16:17

1
Çünkü @Patrick Sen benim cevap içine çok fazla okuma olabilir olduğunu onlar pedagojik edilebilir mi alakası vardır: nedenleri hakkında açık büyük veya değil. n
whuber

50

Tanım olarak, varyans, ortalamadan kare farkların toplamı alınarak ve boyuta bölünmesiyle hesaplanır. Genel formül bizde

neredeμortalama veNpopülasyonun boyutudur.σ2=iN(Xiμ)2NμN

Bu tanımlamaya göre, bir örneğin (örneğin örneği ) varyansı da bu şekilde hesaplanmalıdır.t

burada ¯ X, ortalama ven,bu küçük numune boyutu.σt2=in(XiX¯)2nX¯n

Ancak, örnek varyansı ile , biz nüfus varyans tahmin edicisi σ 2 . Σ 2'yi nasıl tahmin edebilirizS2σ2σ2 sadece örnekteki değerleri kullanarak ?

Yukarıdaki formüllerde göre, rasgele değişken örnek ortalaması sapma ¯ X ile varyans σ 2 t . Örneklem ortalaması ¯ X ayrıca σ 2 varyansı ile μ ' den sapar.XX¯σt2X¯μ çünkü numune ortalaması numuneden numuneye farklı değerler alır ve ortalamaμve varyansσ2ile rastgele bir değişkendirσ2nμ . (Kolayca kanıtlanabilir.)σ2n

Bu nedenle, yaklaşık, sapma halinde u iki varyanslar böylece bu iki toplayın ve elde içeren bir varyans ile σ 2 = σ 2 t + σ 2Xμ . Bunu çözerek,σ2=σ 2 t ×n olur.σ2=σt2+σ2n . Σ 2 t'nin değiştirilmesitahmincimize popülasyon varyansı için verir:σ2=σt2xnn-1σt2

.S2=Σbenn(Xben-X¯)2n-1

Bir de nin doğru olduğunu ispatlayabilir .E[S2]=σ2


Umarım bu çok önemsiz değildir: örnek ortalamanın ND'ye yakınsadığıdır ( , σμ ) n keyfi olarak büyüdükçe, örneklem ortalamasınınσ2varyansı ile gerçek ortalamadan sapmasının nedeniσn ? σ2n
RexYuan

6
Bu diğerlerinden daha iyi bir açıklama çünkü sadece yagga yagga'ya istatistiksel terimlerle gitmek yerine denklemleri ve türevleri gösteriyor.
Nav,

1
@sevenkul biraz bunu görsel olarak nasıl görebiliriz? derken, X sapma gerektiğini bu net varyans ile, bunu görselleştirmek kaybolduğumμ
Parthiban Rajendran

17

Bu tam bir sezgidir, ancak en basit cevap 0'dan ziyade tek elemanlı bir numunenin standart sapmasını sağlamak için yapılan bir düzeltmedir.


11
Neden olmasın, sonra, n kullanın veya hatta1nn21 düzeltmeler olarak mı? :-)1exp(1)exp(1/n)
whuber

1
Parsimony (@whuber -;

4
daha "kurallara aykırı" dır. :-)1n1
whuber

2
@ mbq, Cevabınız ile ilgili olarak "" 0'dan ziyade tek elemanlı bir numunenin standart sapmasını sağlamak için yapılan bir düzeltmedir ", bu gerçekten neden mi, yoksa bu şaka cevabı mı? Bizim gibi matematikçi olmayanların söyleyemediğini biliyorsun.
Pacerier

4
Resmen, akıldan bir sonuçtur, ama yazdığım gibi, onu ezberlemek için iyi bir niyet olarak buluyorum.

14

Sen daha derin bir anlayışa sahip olabilir değil öyle değil sadece neden yalnız geometri yoluyla terimini n ancak tam da bu halini alır neden, ancak öncelikle baş sezgilerinizi kurmak gerekebilir n boyutlu geometri. Ancak, oradan, doğrusal modellerde (örneğin model df ve artık df) serbestlik derecelerinin daha iyi anlaşılması için küçük bir adımdır. Sanırım Fisher’dan biraz şüphelin1nn bu şekilde düşündüğü hakkında . İşte yavaş yavaş onu oluşturan bir kitap:

Saville DJ, Ahşap GR. İstatistiksel yöntemler: geometrik yaklaşım . 3. baskı New York: Springer-Verlag; 1991. 560 sayfa. 9780387975177

(Evet, 560 sayfa. Yavaş yavaş söyledim.)


Teşekkürler olanlar - Bu yönden bir cevap olacağını düşünmedim. Sezgiyi özetlemenin herhangi bir yolu var mı yoksa mümkün olması mümkün değil mi? Şerefe, Tal
Tal Galili 24:10

Bunu kendim yapamadım, ama bir kitap eleştirmeni bu yaklaşımı Amer'deki bir paragrafta özetledi. Stat. 1993 yılında: jstor.org/stable/2684984 . Bu yaklaşımı tüm kurs için benimsemediğiniz sürece, öğrencilerinizle birlikte kullanmanın gerçekten pratik olduğundan emin değilim.
giderebilirsiniz

Bir kitap referansından ziyade biraz sezgiyi özetleyebilir misiniz?
oliversm

12

Nüfus varyansının tahmincisi, bir popülasyon örneği üzerinde uygulandığında yanlılık göstermektedir. Bu önyargıya ayak uydurabilmek için n yerine n-1 ile bölmek gerekir. Bir kişi matematiksel olarak, örnek varyansın tahmin edicisinin n yerine n-1'e bölündüğü zaman tarafsız olduğunu gösterebilir. Burada resmi bir kanıt sağlanmıştır:

https://economictheoryblog.com/2012/06/28/latexlatexs2/

Başlangıçta, formülün yol açtığı matematiksel doğruluk oldu sanırım. Bununla birlikte, bir kişi bir formüle sezgi eklemek istiyorsa, daha önce belirtilen öneriler makul görünmektedir.

İlk olarak, bir numunenin gözlemleri ortalama olarak popülasyon ortalamasından örnek ortalamasına daha yakındır. Varyans tahmincisi, örneklem ortalamasından faydalanır ve bunun sonucunda nüfusun gerçek varyansını hafife alır. N yerine n-1'e bölünmesi, bu önyargıyı düzeltir.

Ayrıca, n-1'e bölünmesi, tek elemanlı bir numunenin varyansını sıfır yerine tanımsız hale getirir.


12

Neden tarafından böl yerine n ? Çünkü bu alışılmış ve varyansın tarafsız bir tahmininin sonucunu veriyor. Bununla birlikte, Jensen'ın eşitsizliğini içbükey fonksiyonuna karekök uygulayarak görüldüğü gibi standart sapmanın önyargılı (düşük) bir tahminine yol açar.n1n

Peki, tarafsız bir tahminciye sahip olmanın nesi harika? Ortalama kare hatasını mutlaka en aza indirmez. Normal dağılım için MLE, n - 1 yerine ile bölmektir . Öğrencilerinize, yüzyıllar öncesinden eski haline getirilmiş fikirleri yerine getirmeyi ve akılsızca uygulamadan ziyade düşünmeyi öğretin.nn1


8
(+1) Bu durum hakkında ne kadar çok düşünürsem (ve ortaya çıkmasına neden olan ve n - 1'in ortaya çıkmasına neden olmak için Öğrenci 1908 Biyometri katkısı gibi önceki makaleleri araştırmaya kadar, gerçek bir düşünce verdim. ) daha fazla "geleneksel çünkü" tek olası doğru cevap olduğunu düşünüyorum. Olumsuz oyları gördüğüm için mutsuzum ve yalnızca niyetini düşündüğüm halde, OP'ye saldırmak olarak kolayca görülebilecek olan son cümleyi yanıtladıklarını tahmin edebiliyorum. n1
whuber

1
Son cezam, OP'ye yapılan saldırının aksine, tüm ilgililere dostça bir tavsiyeydi.
Mark L. Stone,

Kullanımda, testlerde veya güven aralıklarında kullanıldığında, prosedürün diğer kısımlarını ayarlamak zorunda kalacak ve sonunda aynı sonucu elde etmek zorunda kalacak!
kjetil b halvorsen

8

İkinci dereceden çok iyi bilinmektedir (ya da kolayca kanıtlanmıştır) olan bir extremum sahiptir z = - pαz2+2βz+γ . Bu, herhangi birngerçek sayısındax1,x2,,xn için,G(a)= n i=1(xi-a)2=( n i = 1 x 2 i miktarını gösterir. )-2a( n i = 1 xi)+nz=βαnx1,x2,,xna = 1 olduğunda minimum değere sahiptir.

G(a)=i=1n(xia)2=(i=1nxi2)2a(i=1nxi)+na2,
.a=1ni=1nxi=x¯

Şimdi, in bilinmeyen ortalama μ ve bilinmeyen varyansa sahip bir dağılımdan n büyüklüğü örneği olduğunu varsayalımxinμ . Μ olaraktahmin edebiliriz 1σ2μ hesaplamak için yeterince kolay olmakla birlikte, bir girişim tahmin etmek için hangiσ2 olarak11ni=1nxi=x¯σ2bilmediğimiz bir sorunla karşılaştıμ. ElbetteG( ˉ x ) 'ikolayca hesaplayabiliriz veG(μ)G( ˉ x )olduğunu biliyoruz, fakatG(μ)ne kadar büyük? Cevap G(μ)1ni=1n(xiμ)2=n1G(μ)μG(x¯)G(μ)G(x¯)G(μ)G(μ)daha büyük olan bir yan faktörü yaklaşık olarak nG(x¯) , yani, G ( μ ) nnn1ve böylecetahminn-1G(μ)=1

(1)G(μ)nn1G(x¯)
dağılımının varyansı için1ile yaklaşık olabilir n1G(μ)=1nΣben=1n(xben-μ)21n-1G,(x¯)=1n-1Σben=1n(xben-x¯)2.

Öyleyse, ( 1 ) ' in sezgisel açıklaması nedir? Evet, bizde o G ( μ ) var(1) çünkü n i = 1 (xi- ˉ x )=n ˉ x -n ˉ x =0. Şimdi, n ( ˉ x - μ ) 2

G(μ)=i=1n(xiμ)2=i=1n(xix¯+x¯μ)2=i=1n((xix¯)2+(x¯μ)2+2(xix¯)(x¯μ))=G(x¯)+n(x¯μ)2+(x¯μ)i=1n(xix¯)(2)=G(x¯)+n(x¯μ)2
i=1n(xix¯)=nx¯nx¯=0 biz olan tüm olağanüstü sıradışı örnek olduğunda hariçxıdaha büyük olanu(ya da hepsi daha küçüktür μ),(3)'ün sağ tarafındaki çift toplamdaki(xi-μ)(xj-μ)toplamları
n(x¯μ)2=n1n2(i=1n(xiμ))2=1ni=1n(xiμ)2+2ni=1nj=i+1n(xiμ)(xjμ)(3)=1nG(μ)+2ni=1nj=i+1n(xiμ)(xjμ)
xiμμ(xiμ)(xjμ)(3)Olumsuz yanı sıra pozitif değerler alır ve bu nedenle birçok iptal işlemi gerçekleşir. Böylece, çift toplamın küçük mutlak değere sahip olması beklenebilir ve biz sadece 1 ile karşılaştırıldığında görmezden geliyoruz. (3)'ün sağındakiG(μ)terimi. Bu durumda,(2) haline G(μ)G( ˉ x )+11nG(μ)(3)(2)
G(μ)G(x¯)+1nG(μ)G(μ)nn1G(x¯)
de talep edildiği gibi .(1)

8
Sadece bu borsanın değişiminde sezgisel bir cevap olarak kabul edilirdi.
Joseph Garvin

6

(xixj)2/2

s2=2n(n1)i<j(xixj)22=1n1i=1n(xix¯)2.

XY

V(X)=E((XY)22)=E((XE(X))2).

Rastgele değişken varyans tanımından örnek varyans tanımına gitmek, tipikliğin felsefi ilkesiyle gerekçelendirilebilecek bir ortalama beklentisini tahmin etme meselesidir: Örnek, dağılımın tipik bir gösterimidir. (Bunun, anların tahminiyle aynı olduğunu ancak aynı olmadığını unutmayın.)


2
V(X)=E((X-Y)22)=E((X-E(X))2)

4
(xben-xben)2s2nn-1 kendi çiftlerini . (Onlar Çünkü edilir varyans benzer nüfus tanımına dahil, bu bariz bir şey değildir.)
whuber

4

N-=1xm¯=x1

V=ΣN-(xn-m¯)2N-

V¯=(x-m¯)21=0.

yxyN--1=0

0d+1dd+1


“Sonsuz bir varyansın neden daha sağlam bir sonuç olacağı” ndaki sıfır varyanstan ziyade açık değildir. Gerçekten de, "örnek varyansı" , daha fazla kafa karıştırıcı olan bir varyans tahmincisi anlamında kullanıyor görünüyorsunuz .
whuber

1
0<

4

Önerisi whuber , bu cevap arta kopyalandıktan başka benzer bir soru .

Bessel'in düzeltilmesi, örnek varyansın gerçek varyansın bir tahmincisi olarak kullanılmasındaki yanlılığı düzeltmek için benimsenmiştir. Düzeltilmemiş istatistikteki önyargı, örnek ortalamanın gözlemlerin ortasına gerçek ortalamanınkinden daha yakın olması nedeniyle oluşur ve bu nedenle örnek ortalamanın etrafındaki kare sapmalar, sistematik olarak gerçek ortalamanın etrafındaki kare sapmalarını hafife alır.

S*2n

S*2=1nΣben=1n(Xben-X¯)2=1nΣben=1n(Xben2-2X¯Xben+X¯2)=1n(Σben=1nXben2-2X¯Σben=1nXben+nX¯2)=1n(Σben=1nXben2-2nX¯2+nX¯2)=1n(Σben=1nXben2-nX¯2)=1nΣben=1nXben2-X¯2.

Beklentileri dikkate alarak:

E(S*2)=1nΣben=1nE(Xben2)-E(X¯2)=1nΣben=1n(μ2+σ2)-(μ2+σ2n)=(μ2+σ2)-(μ2+σ2n)=σ2-σ2n=n-1nσ2

Böylece düzeltilmemiş örneklem varyans istatistiğinin gerçek varyansı hafife aldığını görebilirsiniz. σ2. Bessel'in düzeltme payda ile değiştirirn-1Bu tarafsız bir tahmin ediciyi sağlar. Regresyon analizinde bu, tahmin edilen ortalamanın çoklu tahmincilerin doğrusal bir fonksiyonu olduğu daha genel duruma genişletilir ve bu son durumda, serbestlik derecelerinin düşük olması için payda daha da azalır.


Kanıt için teşekkürler!
Haziran’da

0

Genelde payda "n" kullanmak, tahmin etmek istediğimiz nüfus varyansından daha küçük değerler verir. Bu, özellikle küçük numuneler alınırsa olur. İstatistik dilinde, örneklem varyansının popülasyon varyansının “önyargılı” bir tahminini sunduğunu ve “tarafsız” yapılması gerektiğini söylüyoruz.

Sezgisel bir açıklama arıyorsanız, öğrencilerinizin gerçekten örnekler alarak nedenlerini görmelerine izin vermelisiniz! Bunu izle, soruna kesin cevap veriyor.

https://www.youtube.com/watch?v=xslIhnquFoE


0

Örnek ortalama, X¯=1nΣben=1nXben, oldukça sezgisel. Ancak örnek varyansıS2=1n-1Σben=1n(Xben-X¯)2. Neredeydin-1 dan geliyorum ?

Bu soruyu cevaplamak için tarafsız bir tahmincinin tanımına geri dönmeliyiz. Tarafsız bir tahminci, beklentisi gerçek beklenti eğilimindedir. Örnek ortalama tarafsız bir tahmin edicidir. Nedenini görmek için:

E[X¯]=1nΣben=1nE[Xben]=nnμ=μ

Örneklem varyansının beklentisine bakalım,

S2=1n-1Σben=1n(Xben2)-nX¯2

E[S2]=1n-1(nE[(Xben2)]-nE[X¯2]).

Dikkat edin X¯ rastgele bir değişkendir ve sabit değildir, beklenti E[X¯2]bir rol oynar. Arkasındaki nedeni bun-1.

E[S2]=1n-1(n(μ2+σ2)-n(μ2+Vbirr(X¯))).
Vbirr(X¯)=Vbirr(1nΣben=1nXben)=Σben=1n1n2Vbirr(Xben)=σ2n

E[S2]=1n-1(n(μ2+σ2)-n(μ2+σ2/n)).=(n-1)σ2n-1=σ2

Gördüğünüz gibi, paydamız varsa n onun yerine n-1, varyans için önyargılı bir tahmin alırdık! Fakatn-1 tahminci S2 tarafsız bir tahmin edicidir.


3
Ama bunu takip etmiyor S standart sapmanın tarafsız bir tahmincisidir.
Scortchi

-1

Bence Bayesian tahmininin bağlantısını işaret etmeye değer. Verilerinizin Gauss olduğunu varsaydığınızı varsayalım ve ortalamayı ölçtünüz.μ ve varyans σ2 bir örnek npuan. Nüfus hakkında sonuç çıkarmak istersiniz. Bayesian yaklaşımı, genelleştirilmiş bir Öğrenci T dağılımı (T-testin kökeni) olan örnek üzerindeki posterior öngörücü dağılımı değerlendirmek olacaktır. Bu dağılımın anlamıμve değişkenlik

σ2(n+1n-1),

Bu tipik düzeltmeden bile daha büyük. (Var2n özgürlük derecesi.)

Genelleştirilmiş Student'in T dağılımının üç parametresi vardır ve istatistiklerin üçünden de faydalanır. Bazı bilgileri atmaya karar verirseniz, sorunuzda açıklandığı gibi iki parametreli normal dağılım kullanarak verilerinizi yaklaşık olarak tahmin edebilirsiniz.

Bir Bayesian bakış açısından, modelin hiperparametrelerinde belirsizliğin (ortalama ve varyansa göre dağılımlar) posterior öngörücünün varyansının popülasyon varyansından daha büyük olmasına neden olduğunu hayal edebilirsiniz.


-4

Aman Tanrım, karmaşıklaşıyor! Basit cevabın "n" 'i kullanabileceğiniz tüm veri noktalarına sahipseniz, ancak "örnek" e sahipseniz, bunun rasgele bir örnek olduğunu varsayarsak, standart sapmanın içinden daha fazla örnek noktaya sahip olduğunu düşündüm. dışarıdan (standart sapma tanımı). İhtiyacınız olan tüm veri noktalarını rastgele almak için dışarıda yeterli veriye sahip değilsiniz. N-1 "gerçek" standart sapmaya doğru genişlemeye yardımcı olur.


3
Bu mantıklı değil. SD'nin içinden dışarıdan daha fazla puan mı? Bunun anlamı, ortalamanın 1 SD'si içinde değil, içinde olması halinde, bunun doğru olup olmadığının, örnek almakla hiçbir ilgisi yoktur. Ortalama etrafında aralıklarla kesirler üzerinde gerekli kısıtlamalar için, bkz Chebyshev eşitsizliği. Buradaki ana soruya "genişlemeye yardımcı olur" açıklamıyorn-1 hiç değilse, tartışmanızı bile veriyor gibi n-2Hala daha iyi olabilir ve bunun gibi, burada cebir olmadığı için, hatta dolaylı olarak bile. Ne yazık ki bu, yanlış ya da alakasız, karışık bir fikir seti dışında diğer cevaplara hiçbir şey eklemez.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.