P değeri bir nokta tahmini midir?


32

Kişi p-değerleri için güven aralıklarını hesaplayabildiğinden ve aralık kestiriminin tersine nokta tahmini olduğu için: p-değeri bir nokta tahmini midir?


6
Bir inanmıyorum edebilirsiniz p-değeri için güven aralıkları hesaplamak; veri üreten süreci açıklayan bir parametre değil, verilerden hesaplanan bir istatistiktir. Tabii ki hala bir istatistik tahmin ne olduğunu sorabilirsiniz.
Scortchi - Eski Monica

1
@Scortchi: p değerlerinin dağılımını hesaplamak için örneğin önyükleme uygulamam ve ardından bu önyükleme dağılımının yüzde 95'lik bir aralık aralığını oluşturacak olsaydım, p değeri için bir güven aralığı değilse - ne o mu?
amip diyor Reinstate Monica

2
@ amoeba: bir güven aralığı bilinmeyen bir parametre hakkındadır, önyükleme aralığınız bir istatistik için% 95'lik bir bölgenin yaklaşık değeridir.
Xi'an

@Scorthci: P-değerleri için CI'ları basan bir yazılım gördüm. Bu durumda, yaklaşık p değerleri permütasyon testleri ile hesaplanmıştır, bu nedenle eğer CI çok genişse (yani p değeri ve p değeri [ 0.05 , 1 ] ), daha fazla permütasyon kullanırsınız. çıkarım yapmadan önce. [0,0.05][0.05,1]
Cliff AB

4
@Cliff Bu , bir dağılımın p-değeri qua özelliği için bir güven aralığı değil : belirli bir numune için bir testin p-değerinin stokastik bir tahmincisi için bir güven aralığı. Her ne kadar benzer görünseler ve her ikisi de aralıklı olsa da, tamamen farklı şeylerdir.
whuber

Yanıtlar:


23

Nokta tahminleri ve güven aralıkları, dağılımı tanımlayan parametreler içindir, örneğin ortalama veya standart sapma.

Ancak, örnek ortalama ve örnek standart sapma gibi diğer örnek istatistiklerden farklı olarak, p değeri ilginç bir dağıtım parametresinin faydalı bir tahmincisi değildir. Teknik ayrıntılar için @whuber tarafından verilen cevaba bakınız.

Bir test istatistiğinin p değeri, boş hipotezin doğru olduğu varsayımıyla hesaplanan, numunede gözlemlenen kadar büyük, test istatistiğinin beklenen değerinden bir sapma gözlemleme olasılığını verir. Dağılımın tamamına sahipseniz, boş hipotezi ile tutarlıdır veya değildir. Bu gösterge değişkeniyle tanımlanabilir (yine cevabı @whuber'a bakınız).

Fakat p-değeri gösterge değişkeninin faydalı bir tahmincisi olarak kullanılamaz çünkü boş hipotez doğruysa, örneklem büyüklüğü arttıkça p-değeri birleşmediğinden tutarlı değildir. Bu, istatistiksel bir testin boş değeri reddedebileceğini veya reddedebileceğini, ancak hiçbir zaman onaylamadığını bildirmenin oldukça karmaşık bir alternatif yoludur.


3
İstatistiksel testlerin daha iyi hesaplarının çoğu (Lehman, Kiefer, vb.) “Popülasyonlara” atıfta bulunmaz, bunun yerine durumu dağılım parametrelerini tahmin etme açısından çerçeveler . Bu, rastlantının yalnızca örneklemeden kaynaklanmasını gerektirmez ve bu nedenle, teorinin rastgele bir modelin parçası olduğu durumlara daha geniş bir şekilde uygulanmasını sağlar .
whuber

2
Ancak, açık bir şekilde, "nüfusla hiçbir şekilde ilişkili olasılık bulunmadığı" ifadesiyle çeliştiniz. Lütfen, tüm tahmin edicilerin "açıkça numune düzeyinde tanımlandığını" unutmayın . Bu nedenle, bu yazıda ne gibi bir ayrım yapmaya çalıştığınızı belirlemek zor.
whuber

2
Tabii ki! Ancak bir dağıtım bir nüfus değildir.
whuber

4
(-1) Hem Tim'in ortak-duyusal cevabı hem de whuber'in yanıtını hem kabul ettiğim hem de bunun cevabını kabul ediyorum. (1) "Ancak p-değeri bir popülasyon parametresi değildir, çünkü açıkça örneklem düzeyinde tanımlanmıştır": bu şüphe etmeye değmez, ama "ama" bir p-değerinin yapabileceğini söylediğiniz gibi görünüyor bir şeyin tahmini olmayın, çünkü bu bir örnek istatistiktir, sanki örnek ortalaması hiçbir şeyin tahmini olamaz, çünkü bu bir örnek istatistiktir. ...
Scortchi - Eski Monica

2
(2) “Bunun nedeni, popülasyonla ilişkili hiçbir olasılık olmaması, sabit ancak bilinmeyen olarak görülmesidir”: (a) p-değeri örnekten hesaplanmamıştır çünkü "olasılık yoktur [.. .] "; (b) @ whuber'ın işaret ettiği gibi, sınırlı bir popülasyondan örnekleme özel bir durumdur; (c) Her durumda, p-değerinin nüfus hakkında hiçbir şey tahmin etmediğini söylediklerinizden hemen sonra gelmediği.
Scortchi - Monica'yı yeniden kur

21

Evet, bir p değerinin bir nokta tahmini olduğu söylenebilir (ve iddia edilmiştir).

Bir dağılımın hangi özelliğini belirlemek için bir p değerinin tahmin edebileceğini belirlemek için, asimptotik olarak tarafsız olduğunu varsaymalıyız. Fakat asimptotik olarak, sıfır hipotezi için ortalama p değeri (ideal olarak; bazı testler için sıfırdan farklı bir sayı olabilir) ve diğer hipotezler için 0'dır . Dolayısıyla, p-değeri, sıfır hipotezi için gösterge fonksiyonunun yarısının bir tahmincisi olarak düşünülebilir.1/20


Kuşkusuz, bu şekilde bir p değerini görüntülemek biraz yaratıcılık gerektirir. Söz konusu tahminciyi p-değeri ile verdiğimiz karar olarak görerek biraz daha iyi yapabiliriz: temel dağılım boş hipotezin veya alternatif hipotezin bir üyesi midir? Bu olası kararlar kümesini diyelim . Jack Kiefer yazıyorD

İstatistiğin sonucunu gözlemleyebilecek bir deney olduğunu varsayalım. Bu sonuç, rastgele bir değişken veya rastgele bir ... vektörüyle açıklanmaktadır . X'in olasılık yasası istatistikçiler tarafından bilinmemektedir, ancak X'in dağılım fonksiyonunun F , belirtilen sınıflandırma fonksiyonları sınıfının bir üyesi olduğu bilinmektedir . ...XXFXΩ

İstatistiksel sorun bir sorun olduğu söylenir nokta tahmini ise bazı gerçek veya vektör değerli özelliğinin olası değerleri toplamıdır F bağlıdır F oldukça pürüzsüz bir şekilde.DFF

Bu durumda, ayrık olduğu için "oldukça düzgün" hiç bir kısıtlama değildir. Kiefer'in terminolojisi bunu “nokta tahminciler” yerine “testler” olarak ayrık karar alanlarına sahip istatistiksel prosedürlere atıfta bulunarak yansıtmaktadır.D

Bu tanımların sınırlarını (ve sınırlamalarını) keşfetmek ilginç olsa da, bu soru bizi yapmaya davet ettiğinden, belki de bir p-değerinin bir nokta tahmincisi olduğu konusunda güçlü bir şekilde ısrar etmemeliyiz, çünkü tahmin ediciler ve testler arasındaki bu ayrım hem kullanışlı ve geleneksel.


Bu soruya yapılan bir yorumda Christian Robert, kendisi ve ortak yazarların bu bakış açısını tam olarak ele aldığı ve p değerinin gösterge işlevinin bir tahmincisi olarak kabul edilebilirliğini analiz ettiği bir 1992 makalesine dikkat çekti . Aşağıdaki referanslardaki bağlantıya bakınız. Kağıt başlıyor

Hipotez testine yönelik yaklaşımlar genellikle test sorununu tahmin etmekten çok karar vermeden biri olarak ele almıştır. Daha kesin olarak, resmi bir hipotez testi, bir hipotezin doğru olup olmadığına ve sonuçla ilişkilendirmek için bir kanıt ölçüsü sağlamayacağına dair bir sonuca yol açacaktır. Bu yazıda hipotez testini karar teorik çerçevesindeki bir tahmin problemi olarak görüyoruz ....

[Vurgu eklenmiştir.]


Referanslar

Jiunn Tzon Hwang, George Casella, Hristiyan Robert, Martin T. Wells ve Roger H. Farrell, Testlerde Doğruluk Tahmini . Ann. Devletçi. Cilt 20, Sayı 1 (1992), 490-509. Erişimi aç .

Jack Carl Kiefer, İstatistiksel Çıkarımlara Giriş . Springer-Verlag, 1987.


2
Hmm. Bu görüşün yardımcı olup olmadığından emin değilim. Birincisi, p-değeri iyi bir tahmin edici değildir, çünkü boş hipotezi doğruysa tutarlı değildir. Bazı durumlarda (bundan bahsediyorsunuz), örneklem büyüklüğüne bağlı bir yanlılığı da var. Teknik olarak doğru olabilir, ancak herhangi bir rastgele sayı, herhangi bir parametre için de (korkunç) tahmin edici olabilir.
Erik

10
Soru, p değerinin iyi bir tahmin edici olup olmadığını sormuyor , @Erik. Bir tahminci olarak, belirgin eksiklikleri var. Örneğin, sıfır hipotezi için asimptotik varyansı sıfırdır. Neredeyse her yansız tahmin edicinin önyargısının örneklem büyüklüğüne bağlı olduğunu lütfen unutmayın . Bağımsız bir rastgele sayının tahmin edici olarak görülebildiği konusunda haklı olsanız da, farklı bir şeyin tahmincisi olacaktır: kendi tanımını (tanımını kullanarak) tahmin eder. Bu nedenle itirazlarınız eldeki soru ile ilgili değil gibi görünüyor.
whuber

7
Belki de "yararsız" kısmı dışında, @Erik'in bu noktalardan hiçbirinde farklı olduğumuzu sanmıyorum. Nick Cox'un bu konudaki başka bir yerde yaptığı bir yorumda işaret ettiği gibi, bir p-değerinin bir tahminci olarak kabul edilebileceği ve tam olarak tahmin edilebilecek şeyleri düşünmek ilginçtir . Bu sadece bir p-değerinin ne olduğunu (ve ne olmadığını) biraz daha iyi anlamamıza yardımcı olabilir. Birçoğu bunu yararlı bir alıştırma olarak görür .
whuber

7
pbenΘ0(θ)

1
@ Xi'an Görüyorum ki biz sadece 23 yıl geride kaldık. Referans için teşekkürler!
whuber

11

pμx¯μp<0.05pp


5
İlk ifadeniz, işlerin sıklıkla nasıl açıklandığını doğru bir şekilde yansıtıyor, ancak yine de yeterince derinlemiyor. Buradaki temel bir gerçek örnekleme varyasyonu, örnekten numuneye olan değişkenliktir. Farklı bir örnek alın ve P-değeriniz farklı olacaktır. Tam olarak ne tahmin ettiğini görmek biraz ustalık gerektirir ve (bildiğim kadarıyla) bir parametreyi tahmin etmek olarak açıklamak geleneksel değildir, ancak bu bakış açısı mükemmel bir anlam ifade eder. @ Whuber'in ilginç cevabını görün. (Tüm bölge, öğretimi basitleştirme ihtiyacına dayanan çamurlu paraşütlerle doludur.)
Nick Cox

1
Terimlerin nasıl kullanıldığı ilginç ve önemlidir (ve bu arada kişisel bir görüşme). Soru P-değeri nedir kalır olduğunu . Bu da, bu iş parçacığının başka bir yerinde [burada kaçınılmaz pun] olduğuna işaret ediyor. Parametreleri, bir model spesifikasyonunda görünen bilinmeyenler olarak kabul etmek yararlı bir kuraldır, ancak başka bilinmeyenler de vardır.
Nick Cox,

3
p<0.05p<0.01p<0.001p=0.003p<0.05αp<α
amip Reinstate Monica

5
Bu soru, çoğu tartışmalı olan birçokları ile kesişmektedir. Birincisi, bir testin amacının evet ya da hayır kararını vermektir, ki bu da tüm sorunlara uymuyor. Diğer bir önemli husus, eşik seviyelerinin kullanımının onlarca yıl boyunca, insanların bilgisayarları kullanmadıkları halde, basılı tablolardan yayınlanan tabloları kullanmalarının ve kesin P değerlerinin erişilmemesi durumudur.
Nick Cox,

4
@ 00schneider: Eğer p-değerleri için verilen bir aralık görürseniz, whuber tarafından tanımlanan popülasyon parametresi için bir güven aralığı olması pek mümkün değildir. Tim'in amacı, onları bir şey tahmin etmek olarak düşünmeye gerek kalmaması , ilginç olsa bile ilginç.
Scortchi - Eski Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.