1. persentilin örnekleme dağılımını elde etmek için bootstrap kullanma


9

Bir popülasyondan (250 büyüklüğünde) bir örnek var. Nüfusun dağılımını bilmiyorum.

Ana soru: Ben 1'in bir nokta tahminini istiyorum st nüfusun -percentile ve sonra benim tahmini noktadaki% 95 güven aralığı istiyorum.

Benim nokta tahmini örnek 1 olacak st -percentile. İfade ediyorumx.

Bundan sonra, nokta tahmini etrafında güven aralığı oluşturmaya çalışıyorum. Burada bootstrap kullanmanın mantıklı olup olmadığını merak ediyorum. Bootstrap konusunda çok deneyimsizim, bu yüzden uygun terminolojiyi vb.

İşte böyle yapmaya çalıştım. Orijinal örneğimin yerine 1000 rastgele örnek çiziyorum. Ben 1 elde st bunların her birinden -percentile. Böylece 1000 puana sahip - "1 st -percentiles". Bu 1000 noktanın ampirik dağılımına bakıyorum. Ortalamasını belirtiyorumxmebirn. Bir "yanlılığı" şu şekilde belirtirim:önyargı=xmebirn-x. Ben 2.5 almak inci -percentile ve 97.5 inci Ben 1 civarında bir% 95 güven aralığı dediğimiz 1000 puan yüzdelik alt ve üst sınırına elde etmek st orijinal numunenin -percentile. Bu noktaları belirtiyorumx0.025 ve x0.975.

Kalan son adım 1 civarında olduğu bu güven aralığını adapte olan st arasında -percentile nüfusu 1 yerine etrafında st arasında -percentile orijinal numunenin . Böylece alıyorumx-önyargı-(xmebirn-x0.025) alt uç olarak ve x-önyargı+(x0.975-xmebirn)Nüfusun 1 tahmini noktadaki% 95 güven aralığının üst uç olarak st -percentile. Bu son aralık aradığım şeydi.

Bir can alıcı noktası, bence, o 1 için kullanılması bootstrap mantıklı olup olmadığıdır st oldukça yakındır nüfusun bilinmeyen altta yatan dağılımının kuyruk etmektir -percentile. Sorunlu olabileceğinden şüpheleniyorum; minimum (veya maksimum) bir güven aralığı oluşturmak için bootstrap kullanmayı düşünün.

Ama belki de bu yaklaşım kusurludur? Lütfen bana haber ver.

DÜZENLE:

Ampirik 1: biraz daha sorun hakkında düşünce olması, benim çözüm aşağıdaki ima görüyoruz st orijinal numunenin yüzdelik 1 önyargılı bir tahmincisi olabilir st nüfusun yüzde birlik. Ve eğer öyleyse, nokta tahmini önyargılı olarak ayarlanmalıdır:x-önyargı. Aksi takdirde, sapma ayarlı güven aralığı, sapma ayarlanmamış nokta tahminiyle uyumlu olmaz. Hem nokta tahminini hem de güven aralığını ayarlamam ya da hiçbirini ayarlamam gerekiyor.

Öte yandan, tahminin önyargılı olmasına izin vermediysem, önyargı ayarlaması yapmak zorunda kalmazdım. Yani, alacağımx nokta tahmini olarak ve x-(xmebirn-x0.025) alt uç olarak ve x+(x0.975-xmebirn)% 95 güven aralığının üst ucu olarak. Bu aralığın mantıklı olup olmadığından emin değilim ...

Bu yüzden herhangi bir anlam numune 1 varsaymak yaratıyor st yüzdelik nüfus 1 yanlı tahmindir st yüzdelik? Değilse, alternatif çözümüm doğru mu?


Bu doğrudan bootstrap sorusunu ele almıyor, ancak size yardımcı olabilir: onlinecourses.science.psu.edu/stat414/node/231
shadowtalker

Yanıtlar:


11

Bir dağılımın uç noktaları için bootstrap çıkarımları genellikle şüphelidir. N-out-n-boot önyüklemesi yapılırken boyut örneğindeki minimum veya maksimumn, var 1-(1-1/n)n~1-exp(-1)=63.2% Aşırı gözleminizi örneklemeniz ve aynı şekilde exp(-1)-exp(-2)=23.3%ikinci aşırı gözleminizi yeniden üretme şansı vb. Kuyruktaki altta yatan dağılımın şekli ile ilgisi olmayan deterministik bir dağılım elde edersiniz. Ayrıca, dağıtım bu değerin altında desteğe sahip olsa bile, bootstrap size örnek minimum değerinizin altında bir şey veremez (normal gibi çoğu sürekli dağıtımda olduğu gibi).

Çözümler karmaşıktır ve aşırı değer teorisinden asimptotik kombinasyonlarına ve n gözleminden daha az alt örneklemeye dayanır (aslında, çok daha az, oran sıfıra yaklaşmalıdır.n).


Cevap yardımcı olur, ancak bootstrap davranışı açısından 1. persentilin minimum seviyeye ne kadar yakın olduğu hakkında bir fikir edinmek isterim? Çok büyük örneklerde 1. persentilin minimumdan "uzak" olarak kabul edilebileceğini ve yukarıda listelenen problemlerin göz ardı edilebileceğini, küçük örneklerde ise 1. persentilin minimum olacağını ve problemlerin çok önemli olacağını düşünüyorum. Böylece aramızda bir yerdeyiz. 250 gözlem örneklemimin bu açıdan oldukça küçük olması gerektiğini düşünüyorum.
Richard Hardy
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.