Güven aralıkları ne zaman faydalıdır?


30

Doğru anlarsam bir parametrenin güven aralığı, belirli bir örnek oranı için gerçek değeri içeren aralıkları veren bir yöntem tarafından oluşturulan bir aralıktır. Dolayısıyla 'güven', belirli bir örneklemden hesapladığım aralıktan çok yöntemle ilgilidir.

Bir istatistik kullanıcısı olarak, tüm örneklerin alanı varsayımsal olduğu için bunu hep aldattım. Sahip olduğum tek şey bir örnek ve bu örneğin bana bir parametre hakkında ne söylediğini bilmek istiyorum.

Bu yargı yanlış mı? En azından bazı durumlarda istatistik kullanıcıları için anlamlı olacak olan güven aralıklarına bakmanın yolları var mı?

[Bu soru bir matematik sorusunda güven aralıkları kesildikten sonra ikinci düşüncelerden kaynaklanıyor https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572 # 7572 ]

Yanıtlar:


15

CI'leri Hipotez Testi (HT) çerçevesinden, en azından Neyman'ın yaklaşımını izleyen ikili karar çerçevesinden kaçmanın bir yolu olarak düşünmeyi ve bir şekilde ölçüm teorisine uymayı seviyorum . Daha doğrusu, onları bir tahminin güvenilirliğine daha yakın olarak görüyorum (örneğin, araçların bir farkı) ve bunun aksine, HT, hipotetik çıkarımsal muhakemeye daha yakın, tuzaklarıyla (null kabul edemiyoruz, alternatif ise; genellikle stokastik, vb.) Yine de, hem aralık kestirimi hem de HT ile, numunemizden genel popülasyona ya da bir temsili örneğine (en azından içinde) çıkarım yapmamıza izin veren çoğu zaman (örneğin altında bir örnekleme dağılımı ) dağıtım varsayımlarına dayanmak zorundayız . sık yaklaşım yaklaşımı).H0

Birçok bağlamda, CI'lar olağan HT'yi tamamlayıcı niteliktedir ve ben onları aşağıdaki resimde görüyorum ( altında ):H0

alt metin

yani, HT çerçevesinin altında (solda), istatistiklerinizin boşluğa ne kadar uzak olduğuna bakarken, CI'lerle (sağda) boş bir etkiyi "istatistiğinizden" belirli bir anlamda inceliyorsunuz.

Ayrıca, oran oranları gibi belirli bir istatistik türü için HT'nin genellikle anlamsız olduğunu ve asimetrik olan ve varsa ilişkinin yönü ve kesinliği ile ilgili daha fazla bilgi sağlayan ilişkili CI'ye bakmanın daha iyi olduğuna dikkat edin.


Neden hipotez testlerinin olasılık oranları için bir anlam ifade etmediğini düşünüyorsunuz? Bunun yerine güven aralıklarının sonlu örneklerdeki asimetrik örnekleme dağılımları ile olasılık oranları ve diğer tahminler için standart hatalardan daha faydalı olduğunu vurguluyorum.
saat

@onestop Şey, kısmen "asimetrik örnekleme dağılımları ..." hakkında söylediklerinizi düşünüyordum (ve çok net değilmişim gibi görünmüyor), ayrıca epidemiyolojik çalışmalarda genellikle en fazla CI'lar ile ilgileniyoruz. (bizim tahminimiz ne kadar kesindir) HT’den.
chl

+1. Bu, bana komutları kullanarak atlayarak ve etrafındaki şeyleri değiştirerek, farklı şeyler deneyerek asimptot öğrenmek için kullandığımı hatırlatıyor. Bunun için tekrar teşekkürler, başlamak için çok yardımcı oldu.
ars

@ars Aslında, bu resmin PStricks ile yapıldığını hatırlıyorum. Neyse, Asymptote için iyi bir başlangıç ​​noktası piprime.fr/asymptote'dir .
chl

@ chl, bu konu dışı olabilir, ancak bu grafikleri R'de yapıp yapmadığınızı bana söyleyebilir misiniz?
suncoolsu

7

2. Q'nuzla ilgili alternatif bir yaklaşım, "En azından bazı durumlarda, istatistik kullanıcıları için anlamlı olacak olan güven aralıklarına bakmanın yolları var mı?":

Bayesian çıkarımına ve sonuçta ortaya çıkan güvenilir aralıklara bir göz atmalısınız . Bir% 95 güvenilir bir aralık olabilir Eğer gerçek parametre değeri de dahil olmak üzere% 95 olasılık vardır inanıyoruz bir aralık olarak yorumlanabilir. Ödediğiniz fiyat , gerçek parametrenin veri toplamadan önce alacağına inandığınız değerlere önceden bir olasılık dağılımı koymanız gerektiğidir . Ve senin Aynı verileri kullanmak bile, sonuçta inandırıcı aralıkları da farklı olabilir, böylece birinden farklı olabilir öncesinde başka, önceki bulunuyor.

Bu sadece özetlemeye yönelik hızlı ve kaba teşebbüsüm! Pratik odaklı iyi bir yeni ders kitabı:

Andrew Gelman, John B. Carlin, Hal S. Stern ve Donald B. Rubin. "Bayesian Veri Analizi" (2. baskı). Chapman & Hall / CRC, 2003. ISBN 978-1584883883


Teşekkürler. Ama özellikle sık sık güven aralıkları? İlgili olabilecekleri herhangi bir durum var mı?
Jyotirmoy Bhattacharya 23:10

Eldeki durum hakkında farklı bilgilere sahipseniz, farklı önceliklere sahip olmanın bir sorun olmadığını (en azından Bayesian nesnesinin objektif bakış açısıyla) olduğuna inanıyorum. Öncelikleri öncül bilgilerimizi yayınlamanın bir yolu olarak görmeye başladık. Bunun basit olmadığını biliyorum ...
teucer

@Jyotirmoy Bayesian'e ve sıkça yaklaşımlara ilişkin olarak, burada ilginç noktalara değinildi
chl

6

Ben bu sorunun öncülünün hatalı olduğunu düşünüyorum çünkü belirsiz ile bilinen arasındaki ayrımı reddediyor .

Bozuk para çevirmek, iyi bir benzetme sağlar. Bozuk para atılmadan önce, sonuç belirsizdir; Daha sonra, artık "varsayımsal" değildir. Bu düşünceyi karıştırmak , anlamak istediğimiz gerçek durumla (madalyonun davranışı veya sonucunun sonucu alınacak kararlar) uyuşmazsa, esasen dünyayı anlama olasılığını reddediyor.

Bu karşıtlık, deneysel ya da düzenleyici bir arenada keskin bir rahatlıkla ortaya çıkar. Bu gibi durumlarda, bilim adamı veya düzenleyici, sonuçları önceden herhangi bir zamanda bilinmeyen durumlarla karşı karşıya kalacağını bilmektedir, ancak deneyi tasarlama veya yönetmeliklere uygunluğu belirlemede kullanılacak kriterleri belirleme gibi önemli tespitler yapmalıdırlar. (uyuşturucu testi, işyeri güvenliği, çevre standartları vb. için). Bu insanlar ve çalıştıkları kurumlar , iyi deneysel tasarımlar ve mümkün olduğunca az hataya yol açan adil karar prosedürleri gibi en iyi ve savunulabilir stratejiler geliştirmek için bu yöntemlerin olasılık özellikleri hakkında bilgi ve yöntemlere ihtiyaç duyarlar .

Güven aralıkları, klasik olarak zayıf gerekçelerine rağmen, bu karar-teorik çerçeveye uyar. Rastgele bir aralık oluşturma yöntemi, aralığın minimum beklenen kapsamını sağlama ve aralığın beklenen uzunluğunu en aza indirgeme gibi iyi özelliklerin bir kombinasyonuna sahip olduğunda - her ikisi de bir priori özellik değil, bir posteriori olanlar - sonra Bu yöntemi kullanmanın uzun bir kariyeri, bu yöntem tarafından belirtilen eylemlerle ilgili maliyetleri en aza indirebiliriz.


Karar vermek için bir güven aralığı kullanma örneği verin. Ya da, daha iyisi, iki güven aralığını ve sık sık çerçevede kalırken, her biriyle nasıl farklı kararlar alacağınızı karşılaştırın.
BrainPermafrost

@Brain Herhangi bir tanıtıcı istatistik ders kitabı bu tür örnekler sağlayacaktır. Sıkça sık olmayan bir kişi Freedman, Pisani ve Purves, Statistics'tir (herhangi bir basım).
whuber

6

% 95 güven aralığının , beklenen değeri içerme olasılığı% 95 olan herhangi bir bireysel aralıktan ziyade, vakaların% 95'inde çalışan bir yöntem kullanmaktan kaynaklanan şeyler olduğunu söylerken haklısınız.

“Güven sınırlarının mantıksal temeli ve yorumlanması, şimdi bile bir tartışma konusu.” {David Colquhoun, 1971, Biyoistatistik Üzerine Dersler}

Bu alıntı, 1971'de yayınlanan bir istatistik ders kitabından alınmıştır, ancak 2010'da hala doğru olduğunu iddia ediyorum. Tartışma, binom oranlar için güven aralıkları söz konusu olduğunda muhtemelen en uç nokta. Bu güven aralıklarını hesaplamak için pek çok rakip yöntem vardır, ancak hepsi bir veya daha fazla anlamda yanlış ve en kötü performans gösteren yöntem bile ders kitabı yazarları arasında savunuculuğa sahip. “Kesin” olarak adlandırılan aralıklar bile, güven aralıklarından beklenen özellikleri verememektedir.

Cerrahlar için yazılmış bir bildiride (istatistiklere ilgi duydukları için yaygın olarak bilinir!), John Ludbrook ve ben, önceki gibi tek tip bir Bayesian kullanılarak hesaplanan güven aralıklarının rutin olarak kullanılmasını savunduk çünkü bu aralıklar diğer yöntemlere göre sıkça özelliklere sahip (ortalama olarak) tüm gerçek oranlarda tam olarak% 95 teminat), ancak daha da önemlisi, gözlenen tüm oranlarda daha iyi bir teminat (tam olarak% 95 teminat). Rapor, hedef kitlesi nedeniyle son derece ayrıntılı değildir ve bu yüzden tüm istatistikçileri ikna etmeyebilir, ancak tüm sonuçları ve gerekçeleri içeren bir takip kağıdı üzerinde çalışıyorum.

Bu, Bayesci yaklaşımın, sıkça görülen bir olay kadar sıkça görülen bir olay olduğu kadar sıkça görülen özelliklere sahip olduğu bir durum. Tekdüzen bir varsayımın varsayımı problemli değildir, çünkü karşılaştığım sık görüşme kapsamının her hesaplanmasında eşit bir nüfus oran dağılımı vardır.

“En azından bazı durumlarda istatistik kullanıcıları için anlamlı olacak olan güven aralıklarına bakmanın yolları var mı?” Diye soruyorsunuz. Öyleyse cevabım, binom güven aralıkları için, gözlenen tüm oranlar için zamanın tam olarak% 95'inin nüfus oranını içeren aralıklar alabilmesidir. Bu bir evet. Bununla birlikte, geleneksel güven aralıklarının kullanımı, tüm nüfus oranlarının karşılanmasını beklemektedir ve bunun için cevabın “Hayır!” Olmasıdır.

Sorunuza verilen cevapların uzunluğu ve onlara verilen çeşitli cevaplar, güven aralıklarının yaygın olarak yanlış anlaşıldığını göstermektedir. Hedefimizi tüm gerçek parametre değerleri için kapsamdan tüm örnek değerler için gerçek parametre değerinin kapsamına kadar değiştirirsek, aralıklar, performansın performansından ziyade doğrudan gözlenen değerlerle doğrudan ilişkili olacak şekilde biçimlendirileceği için daha kolay olabilir. başına yöntem .


5

Bu harika bir tartışma. Bayesian güvenilir aralıkları ve olabilirlik destek aralıkları gibi Bayeslerin ilgili olayların posterior olası olasılıkları (örneğin, bir ilaç etkilidir) olduğunu hissediyorum. Ancak P değerlerini güven aralıklarla desteklemek büyük bir kazançtır. Neredeyse NEJM ve JAMA gibi en iyi tıbbi dergilerin her sayısında, özetlerinde "kanıt yokluğu kanıtı yok" sorunu olan bir makale vardır. Güven aralıklarının kullanılması, bu tür hataların önüne geçecektir. Harika bir küçük metin http://www.amazon.com/Statistics-Confidence-Intervals-Statistical-Guidelines/dp/0727913751


3

Sorunuzu doğrudan ele almak için: Bir tahıl kutusunu belirli miktarda tahılla doldurmak için bir makine kullanmayı düşündüğünüzü varsayalım. Açıkçası, kutuyu fazla doldurmak / doldurmak istemiyorsun. Makinenin güvenilirliğini değerlendirmek istiyorsunuz. Bunun gibi bir dizi test yaparsınız: (a) Makineyi kutuyu doldurmak için kullanın ve (b) Kutuda doldurulmuş tahıl miktarını ölçün.

Toplanan verileri kullanarak, makinenin kutuyu doldurması muhtemel tahıl miktarı için bir güven aralığı oluşturursunuz. Bu güven aralığı, elde ettiğimiz aralığın, makinenin kutuya koyacağı gerçek tahıl miktarını içerme olasılığının% 95 olduğunu söylüyor. Söylediğiniz gibi, güven aralığının yorumlanması, incelenen yöntem tarafından oluşturulan varsayımsal, görünmeyen örneklere dayanır. Ancak, tam olarak bizim bağlamımızda istediğimiz şey budur. Yukarıdaki bağlamda, biz edecek kutusunu doldurmak için tekrar tekrar makineyi kullanmak ve böylece biz kutuya makine dolguları tahıl miktarının varsayımsal, görünmeyen gerçekleşmeleri önemsiyorum.

Yukarıdaki bağlamdan soyutlamak için: bir güven aralığı, inceleme altındaki yöntemi kullanacak olursak (yukarıdaki örnek yöntemde = makinede), tekrar tekrar güven aralığının gerçek parametreye sahip olma ihtimalinin% 95 olacağının garantisi verir. .


2
@Srikant. Yok hayır! Klasik CI'lerin bu şekilde ısırması. Sadelik için bir kutuya doldurulmuş tahıl miktarının ortalama ile normal olduğunu varsayalımμ ve varyans σ2. Güven aralığıμfarklı olan örnekleme dağılımına dayanmaktadır . Belirli bir CI, örnekleme hataları nedeniyle kapalı olabilir ve makinenin performansıyla hiçbir ilgisi yoktur. Tekrar tekrar örnekleme yapmak ve tekrar tekrar CI oluşturmak olsaydı, bunların% 95'i doğru olurdu, ama bu teselli olmaz.
Jyotirmoy Bhattacharya

1
@Jyotirmoy Elbette, belirli bir CI çıkış yolu olabilir. Başka bir deyişle, CI'nin gerçek değeri içermemesi% 5 ihtimaldir. Bununla birlikte, verdiğim yorum CI'ların gerçekte nasıl yapıldığı ile tutarlıdır. Yöntemi tekrar tekrar kullanmayı hayal ediyoruz ve CI'yi, gözlenen CI'nin gerçek değeri içerme olasılığı 0,95 olacak şekilde yapılandırdık. Cevabımın, gerçek değerin gerçekte nerede olduğu olasılığına dair hiçbir şey söylemediğine dikkat edin, güven aralıkları ile değil, sadece güvenilir aralıklarla yapılabilecek bir ifadedir.

1
@Jyotirmoy a için Alt / Üst sınırlar (100-α)Gözlemlenen bir ortalamanın% CI'si, 'H0Burada bir ortalamanın (veya araçların bir farkının) örnekleme dağılımı, numunenize bağlı olarak varsaydığınız dağılımdır (t veya zdağılımı). Srikant'ın cevabını doğru buldum ve yorumu, çerçeveli deneyin ötesine geçmiyor gibi görünüyor. CI'ler rastgele değişkenlerdir.
chl

@Srikant. Belki de cevabımdaki "method = machine" i yanlış anladım. Montaj hattından çıkan tüm kutuların% 95'inin, belirli bir kutu örneğinden türetilen% 95 güven aralığında ağırlığa sahip olacağını söylemiştiniz.
Jyotirmoy Bhattacharya
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.