Nasıl büyük terimlerin birçoğutoplamın yarısına kadar ekle?


11

Düşünün i=1N|Xi| burada X1,,XN bulunur ve CLT bekletilir.
En büyük terimlerin kaç tanesi toplam toplamın yarısını oluşturur?
Örneğin, 10 + 9 + 8 (10 + 9 + 8 + 1) / 2: terimlerin% 30'u toplamın yaklaşık yarısına ulaşır.

Define
sumbiggest( j;X1XN)sum of the j biggest of |X1||XN|
halfsum(N)the smallest j such that sumbiggest( j )sumbiggest(N)/2.

Halfsum için genel bir asimtotik sonuç var mı ( N,μ,σ )?
Basit, sezgisel bir türetme iyi olurdu.

(Bir az Monte Carlo bazen halfsum (anlaşılacağı N ) N ; / 4 kadar
olduğu, 1/4 büyük Xi . 1/2 toplam toplayın
I 0.24 olsun N halfnormal için, 0.19 N için üstel, N = 20, 50, 100 için.)


3
CLT benzeri bir evrensel sonuç beklemeyin. Örneğin, üniform (0,1) değişkenlerin cevabı üniforma (1000,1001) değişkenlerin cevabından çok farklı olacaktır !
whuber

Doğru, yarımsüs elbette ortalamaya ve sd'ye bağlı olacaktır. Peki neden üstel için ~ N / 5?
denis

2
Asimptotik Denis, halfsum için kesme değeri olacaktır olan için pdf; soru sorar ( için ). Düzgün dağılım durumunda, Dilip'in cevabını alırsınız; bir üstel için, . x 0 t f ( t ) d t = 1 / 2 f | X i | N ( 1 - F ( x ) ) F | X i | [ 0 , 1 ] x 0.186682 N N / 5x0xtf(t)dt=1/2f|Xi|N(1F(x))F|Xi|[0,1]x0.186682NN/5
whuber

Yanıtlar:


2

Hayır, genel bir asimtotik sonuç yoktur. Let emretti.Sen , en büyüğüdür. x i x [ 1 ]x[1]x[N]xix[1]

Aşağıdaki iki örneği ele alalım:

1) . Açıkça CLT tutar. Yalnızca ihtiyaç için gözlem. M = 1 M j = 1 | x [ j ] | 1P(x=0)=1M=1j=1M|x[j]|12N|xi|

2) . Açıkça CLT tutar. için gözlemine ihtiyacınız var.M = N / 2 Σ M j = 1 | x [ j ] | 1P(x=1)=1M=N/2j=1M|x[j]|12N|xi|

Önemsiz bir örnek için Bernoulli dağılımı:

3) . CLT bir kez daha tutuyor. Koşullarınızı karşılamak için gözlemlerin ihtiyacınız vardır . Değiştirilmesiyle gibi gibi 0 ile 1 arasında, örneğin 1 ila yakın ya da örneğin 2 ile elde edilebilir.s , N / 2 sP(x=1)=p, P(x=0)=1ppN/2p


4
Cevabın ile arasında herhangi bir yerde olabileceği açıktır , ancak bu, genel bir sonucun bulunmadığı anlamına gelmez. Bunun anlamı, fraksiyonun ortalamanın ve SD gibi temel dağılımın bazı özelliklerine bağlı olduğu cevapları düşünmeliyiz. Bunlar, CLT ile birlikte, nin toplamlarına kıyasla nasıl dağıtıldığı hakkında spesifik ve nicel bilgi sağlamak için yeterlidir, bu nedenle böyle bir sonuç için umut etmek mantıklıdır. N / 2 x [ i ]0N/2x[i]
whuber

1

Düzgün dağılmış rastgele değişkenler için biraz farklı bir tahmin veren kaba bir argüman. üzerinde eşit olarak dağılmış sürekli rasgele değişkenler olduğunu varsayalım . Daha sonra, ortalama değeri . Şaşırtıcı ve tamamen inanılmaz bir tesadüfle, toplamın tam olarak eşit olduğunu varsayın . Biz tahmin etmek istiyorum Yani en büyük değerlerinden kaç için Özetle veya daha fazla. Şimdi, histogram örnekleri ( uniformm dağılımdan çekilmiş çok büyük) yassı kabaca ile [ 0 , 1 ] i X i N / 2 N / 2 X N / 4 N N U [ 0 , 1 ] 0 1 x 0 < x < 1 ( 1 - x ) N x 1 ( 1 + x ) / 2 ( 1 - x ) N ( 1 +Xi[0,1]iXiN/2N/2XN/4NNU[0,1]01ve böylece herhangi bir , , ila arasında kabaca eşit olarak dağıtılmış örneği vardır . Bu numunelerin ortalama değeri ve toplamı eşittir . için toplam aşıyor . Dolayısıyla, en büyük örneklerin aşıyor .x0<x<1(1x)Nx1(1+x)/2N / 4 x 1 / (1x)N(1+x)/2)=(1x2)N/2N/4 (1-1/x1/2N/4(11/2)N0.3NN/4

Bunu biraz genelleştirmeyi deneyebilirsiniz. Eğer , daha sonra herhangi bir için , istediğimiz şekilde olması için bu ortalama normal olan ve varyans . Bu nedenle, değerinde koşullandırılmış , . Çarpın yoğunluğuyla ve (öğrendiği için yarı rastgele toplamından fazla olacak büyük numunelerin ortalama sayısını bulmak için).Y x ( 1 - x 2 ) N / 2 = Y / 2 Y N / 2 N / 12 Y x = iXi=YYx(1x2)N/2=Y/2YN/2N/12Y YY=0Y=Nx=1(Y/N)YY=0Y=N


Aralığında olduğu kısıtlı iki nokta arasındaki mesafe mesafeden daha az olmalıdır, çünkü katlanarak dağıtılamaz ise değerlere Üstel bir rasgele değişken almak . Ne doğru olduğu takdirde bağımsız üstel rastgele değişkenler, daha sonra Koşulları ile ilgili , sıra istatistikleri , içinde eşit olarak dağıtılır . Örneğin, bu soru ve cevabın matematik sitesi SSS'ye bakınız. (devam)1 ( 0 , ) Y 1 , Y 2 , , Y n + 1 Y maks = α Y ( 1 ) , Y ( 2 ) , , Y ( n ) ( 0 , α )(0,1)1(0,)Y1,Y2,,Yn+1Ymax=α Y(1),Y(2),,Y(n)(0,α)
Dilip Sarwate

Her halükarda, benim argümanım sıralı dağılımdan sıralı örnekler arasındaki mesafeleri kullanmaz .
Dilip Sarwate

Haklısın, seni yanlış anladım. Bir yan soru olarak, ölçeklemeden sonra tekdüze rastgele noktalar arasındaki parçalar katlanarak dağıtılmıyor mu? [Wolfram Demonstrations Project'ten Broken Stick Rule] ( demolar.wolfram.com/BrokenStickRule ) elbette üstel görünüyor, kolay mı olmalı? kanıt.
denis

Lütfen yan sorunuza ayrı bir soru olarak sorun.
Dilip Sarwate

Başladıktan sonra, parça uzunluklarının olasılık-dağılımını gördünüz , orada yorum yapabilirsiniz.
denis

0

Diyelim ki X, mutlak değerden kurtulmak için sadece pozitif değerlere sahip.

Kesin bir kanıt olmadan, k için çözmeniz gerektiğini düşünüyorum

(1FX(k))E(X|X>=k)=12E(X) , F için kümülatif dağılım işlevi

ve sonra cevap en yüksek değerleri alınarak verilir .n(1FX(k))

Benim mantığım asimtopik olarak k'dan daha yüksek olan tüm değerlerin toplamının

n(1FX(k))E(X|X>=k)

ve asimtopik olarak toplamın yarısı yaklaşık

12nE(X) .

Sonuç olarak bir örnek durum için tutar nümerik göstermektedir (tek tip ), burada ve elde . Sonucun her zaman tutup tutmayacağı veya daha da basitleştirilebileceği konusunda emin değilim, ancak bunun gerçekten dağıtım fonksiyonu F'ye bağlı olduğunu düşünüyorum.F ( k ) = k k = [0,1]F(k)=kk=(12)

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.