Ağırlıklı bir örnek üzerinde kantilleri tanımlama


12

Kuantilleri hesaplamak istediğim ağırlıklı bir örneğim var. 1

İdeal olarak, ağırlıkların eşit olduğu durumlarda (= 1 veya başka türlü olsun), sonuçlar scipy.stats.scoreatpercentile()ve R'lerinkiyle tutarlı olacaktır quantile(...,type=7).

Basit bir yaklaşım, verilen ağırlıkları kullanarak numuneyi "çoğaltmak" olacaktır. Bu, ağırlık> 1 olan bölgelerde etkili bir şekilde yerel olarak "düz" bir ecdf verir; bu, örnek aslında bir alt örnekleme olduğunda sezgisel olarak yanlış yaklaşım gibi görünür. Özellikle, ağırlıkları 1'e eşit olan bir numunenin ağırlıkları 2 veya 3'e eşit olanlardan farklı niceliklere sahip olduğu anlamına gelir (Bununla birlikte, [1] 'de belirtilen kağıdın bu yaklaşımı kullandığı görülmektedir.)

http://en.wikipedia.org/wiki/Percentile#Weighted_percentile , ağırlıklı persentil için alternatif bir formülasyon verir. Bu formülasyonda, aynı değerlere sahip bitişik numunelerin önce birleştirilip birleştirilmeyeceği ve ağırlıklarının toplanıp toplanmayacağı açık değildir ve her durumda sonuçları quantile(), ağırlıksız / eşit ağırlıklı durumda R'nin varsayılan tip 7 ile tutarlı görünmemektedir . Quantiles üzerindeki wikipedia sayfası, ağırlıklı durumdan hiç bahsetmiyor.

R'nin "tip 7" kantil fonksiyonunun ağırlıklı bir genellemesi var mı?

[Python kullanarak, ama sadece bir algoritma arıyor, gerçekten, böylece herhangi bir dil yapacak

M

[1] Ağırlıklar tamsayılardır; ağırlıklar, http://infolab.stanford.edu/~manku/papers/98sigmod-quantiles.pdf . Esasen ağırlıklı numune, ağırlıksız numunenin tamamının bir alt örneğidir; alt numunedeki her bir eleman x (i), tam numunedeki ağırlık (i) elemanlarını temsil eder.


Konu oldukça eski, ama burada ağırlıklı nicelikler için numpy kodu stackoverflow.com/a/29677616/498892
Alleo

Yanıtlar:


5

Bu olası bir yaklaşımdır:

X1X2XnW1,W2,,Wn

Sk=(k1)Wk+(N1)i=1k1Wi
S1=0Sn=(N1)i=1NWi

pkSkSnpSk+1Sn

Xk+(Xk+1Xk)pSnSkSk+1Sk.

Wi


Eğer numunedeki iki değer eşitse fakat farklı ağırlıklara sahipse bir sorun olabilir.
Henry
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.