Bu alıntı neden standart sapmanın tarafsız bir şekilde tahmin edilmesinin genellikle uygun olmadığını söylüyor?


14

Standart sapmanın tarafsız tahmininin hesaplandığını ve okuduğum kaynağın

(...) bazı önemli durumlar dışında, görev, istatistik uygulamalarıyla çok az ilişkilidir, çünkü önem testlerinin ve güven aralıklarının kullanılması gibi standart prosedürlerle veya Bayes analizi kullanılarak ihtiyaçtan kaçınılır.

Herkes bu ifadenin ardındaki mantığı aydınlatabilir mi diye merak ediyordum, örneğin güven aralığı standart sapmayı hesaplamanın bir parçası olarak kullanmıyor mu? Bu nedenle, güven aralıkları taraflı bir standart sapmadan etkilenmez mi?

DÜZENLE:

Şimdiye kadar cevaplar için teşekkürler, ama onlar için bazı gerekçeleri takip ettiğimden emin değilim, bu yüzden çok basit bir örnek ekleyeceğim. Mesele şu ki, eğer kaynak doğruysa, o zaman örneğe olan sonucumdan bir şeyler yanlıştır ve birisinin p-değerinin standart sapmaya nasıl bağlı olmadığını göstermesini isterim .

Bir araştırmacının, kentindeki bir testte beşinci sınıf öğrencilerinin ortalama puanının, 0.05'lik anlamlılık düzeyiyle 76'nın ulusal ortalamasından farklı olup olmadığını test etmek istediğini varsayalım. Araştırmacı rastgele 20 öğrencinin örneklemini aldı. Örnek ortalaması 80.85'tir ve örnek standart sapması 8.87'dir. Bu şu anlama gelir: t = (80.85-76) / (8.87 / sqrt (20)) = 2.44. Daha sonra, 19 df ile 2.44'teki iki kuyruklu olasılık değerinin 0.025 olduğunu hesaplamak için bir t-tablosu kullanılır. Bu 0,05 önem seviyemizin altında olduğundan sıfır hipotezini reddediyoruz.

Peki bu örnekte, p-değeri (ve belki de sonucunuz) örnek standart sapmanızı nasıl tahmin ettiğinize bağlı olarak değişmez mi?


2
Verdiğiniz nedenden dolayı bu garip görünüyor. Belki de eksik olduğumuz bir şey olması durumunda bize daha önce paragrafı da verebilirsiniz? Önyargıyı önemli olmayan bir şey, örneklem boyutu büyüdükçe oldukça önemsiz hale gelmesi ve muhtemelen diğer tüm problemlere kıyasla önemli olmamasıdır, örneğin normalde sahip olduğumuz model yanlış spesifikasyonu - ama bu sebep değil kaynağınızda verilen.
Peter Ellis

1
@PeterEllis, bu aslında "standart sapmanın tarafsız olarak tahmin edilmesi" hakkındaki wikipedia sayfasından ( en.wikipedia.org/wiki/UnPrice_estimation_of_standard_deviation ).
BYS2

Yanıtlar:


17

Bu konuda Glen_b ile hemfikirim. Belki noktayı daha da netleştirmek için birkaç kelime ekleyebilirim. Veriler, varyansı bilinmeyen normal bir dağılımdan (iid durumu) geliyorsa, t istatistikleri, güven aralıkları oluşturmak ve hipotez testi yapmak için kullanılan çok önemli miktardır. Bu çıkarım için önemli olan tek şey, sıfır hipotezi (kritik değeri belirlemek için) ve alternatif (güç ve numuneyi belirlemek için) altındaki dağılımıdır. Bunlar sırasıyla merkezi ve merkezi olmayan dağılımlardır. Şimdi bir an için bir örnek problemi göz önüne alındığında, t testi normal bir dağılımın ortalaması için bir test olarak bile optimal özelliklere sahiptir. Şimdi örnek varyansı, popülasyon varyansının tarafsız bir tahmincisidir ancak karekökü, popülasyon standart sapmasının BIASED tahmin edicisidir. Öyle değil t Bu BIASED tahmin edicisinin, önemli miktarın paydasına girmesi önemli değildir. Şimdi tutarlı bir tahminci olması açısından bir rol oynamaktadır. Örneklem büyüklüğü sonsuza giderken t dağılımının standart normale yaklaşmasına izin veren şey budur. Ama herhangi bir sabit için önyargılı olmakn testin hoş özelliklerini etkilemez.

Kanımca, giriş istatistik derslerinde tarafsızlık fazla vurgulanmıştır. Tahmincilerin doğruluğu ve tutarlılığı, vurgulanmayı hak eden gerçek özelliklerdir.

Parametrik veya parametrik olmayan yöntemlerin uygulandığı diğer problemler için, standart sapma tahmini formüle bile girmez.


7
Bu tahmine bağlıdır, ancak 19 serbestlik derecesine sahip t'nin uygulandığı tek bir tahmin vardır ve bu tahmin, örnek varyansın olağan tahmininin kare köküdür. Standart sapmanın farklı bir tahminini kullanırsanız, boş hipotez altında test istatistiği için farklı bir referans dağılımınız vardır. Bu t değil.
Michael R. Chernick

2
@ BYS2: Verdiğiniz örnekte oluşturulan aralık açısından , örnek standart sapmasını bir ölçek faktörü ile çarparak hiçbir şeyin değişmediğini unutmayın (örn. Tarafsız hale getirmek için). Bu durumda test istatistiği dağılımı (hafifçe) değişecektir, ancak inşa edilen CI tam olarak aynı olacaktır! Şimdi, verilere bağlı bazı "düzeltmeler" yaptıysanız, bu farklı bir şey (genel olarak) getirecektir. Yorumuma Glen'in cevabı altında bakın.
kardinal

4
@ BYS2: -statik kullanan normal model durumda , CI ve değeri arasında hoş bir yazışma vardır . Bu nedenle, örnek standart sapmasını bilinen bir sabitle "yeniden ölçeklendirirseniz" değeri değişmez. Örneğin: sabit için . Sonra, ve böylece kritik değer , yani, aralarında bir yazışma. bu mantıklı mı? p p ~ T b = ( ˉ X - μ ) / ( b σ ) = T / b b > 0 P ( ~ T b > u ) = P ( T > b u ) ~ t , b , α = B t αtppT~b=(X¯μ)/(bσ^)=T/bb>0
P(T~b>u)=P(T>bu)
t~b,α=btα
kardinal

1
Cardinal'in doğru bir şekilde işaret ettiği şey, t istatistiğinin temel olarak farklı bir standart sapma tahmini kullanmak için bir sabitle çarpılması mümkün olmadığıdır. Test istatistiği artık t dağılımına sahip değildir. Sabit olduğundan biraz farklı bir dağılımdır. Ortalama b faktörü ile değişir ve standart sapma da değişir. Test istatistiği için kritik değeri hesaplamaya gittiğinizde, yukarıda gösterildiği gibi uygun şekilde değişir.
Michael R. Chernick

1
@ BYS2 Evet, doğru.
Michael R. Chernick

5

Bir t-istatistiği gibi, önemli bir miktar temelinde hesaplanan bir aralığı düşünün. Standart sapma için kestirimcinin ortalama değeri gerçekten buna girmez - aralık, istatistiğin dağılımına dayanır. Yani ifade bu kadarıyla doğru.


1
Evet, ancak istatistiğin dağılımı çoğu durumda bilinmeyen standart sapmasına dayanmıyor, bu nedenle bir tahminci kullanmanız gerekiyor mu?
BYS2

4
(+1) Glen. @ BYS2'ye: Burada birkaç önemli nokta var. Birincisi, elimizde çok önemli bir miktar varsa, güven kümeleri oluşturmak için çok uygun bir yol sağlar, ancak genellikle yoktur. Bir döner miktarda bütün nokta dağılımı bağlı olmasıdır sadece ilgili bilinen miktarlarda. İkinci olarak, önemli miktar altta yatan modele sıkı sıkıya bağlıdır. Veriler varsayılan modelden saparsa, test istatistiğinin dağılımı da ve onun önemli bir miktar olarak karakterizasyonu o kadar alakalı olmayabilir. :)
kardinal

4

Yorum her zaman parça spekülasyonudur, ancak ima edilen anlamın, standart sapmayı açıkça tahmin etmeden genellikle istediğiniz sonucu elde edebileceğinizi düşünüyorum. Diğer bir deyişle, ben yazar kullanırsınız durumlara atıfta düşünüyorum hayır yerine önyargılı tahminden daha, standart sapma tahminini.

Örneğin, bir istatistiğin tüm dağılımına ilişkin bir tahmin oluşturabilirseniz, standart sapmayı kullanmadan güven aralıklarını hesaplayabilirsiniz. Aslında, birçok (normal olmayan) dağılım için, standart sapmanın kendisi (ve ortalama), güven aralığının bir tahminini hesaplamak için yeterli değildir. İşaret testi gibi diğer durumlarda da standart sapma için bir tahmine gerek yoktur.

(Tabii ki, tam bir dağılımın tarafsız bir tahmininin yapılması önemsiz değildir ve Bayesçi istatistiklerde, önyargı yoluyla açıkça önyargı oluşturmak oldukça yaygındır.)


1
Son paragrafla ne kastettiğiniz konusunda biraz daha genişlemek ilginç olabilir. Örneğin, eldeki istatistiğin dağılımından örnek alabilirsem, o zaman ampirik cdf, dağıtım fonksiyonunun noktasal olarak tarafsız bir tahminini oluşturmak için çok kolay ve basit bir yol sağlar. :)
kardinal

1
@cardinal Doğru, ancak bu istatistiğin dağılımından örnek alabileceğinizi varsayar. Bu her zaman mümkün değil. Örneğin, istatistiğini . O bir tarafsız tahmincisi inşa etmek mümkün değildir çıkıyor biz her biri için tarafsız örnekleri elde edebilirsiniz bile, . max i X i X imaxiXimaxiXiXi
MLS

1
: Açık olmak gerekirse sadece rastgele değişken olduğunu ve farz en az 2 farklı değerlere (yani en az iki değişken vardır) alabilir. Aksi takdirde, için tarafsız tahminler oluşturmak o kadar da zor değildir :) i max i X iXiimaxiXi
MLS

2
Bu doğru ve çizmeye çalıştığım noktaya yakın. Son paragrafın ilk cümlesi, doğrusal olmayan bir istatistiksel işlevin, örneğin tek bir rastgele örnekten tarafsız bir tahminini oluşturmaya atıfta bulunur. Bu, fonksiyonun kendisinin rastgele bir örneğinden tam dağılımın tarafsız bir tahminini oluşturmaktan oldukça farklıdır. :-)
kardinal
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.