Dağılımı nedir


17

Her biri [ 0 , 1 ] ' de dört bağımsız düzgün dağılmış değişkenim var . ( A - d ) 2 + 4 b c'nin dağılımını hesaplamak istiyorum . I dağılımı hesaplanabilir u 2 = 4 b C olması f 2 ( u 2 ) = - 1a,b,c,d[0,1](ad)2+4bcu2=4bc

f2(u2)=14lnu24
(dolayısıylau2(0,4]) 'ye aitu1=(ad)2olması
f1(u1)=1u1u1.
Şimdi,toplamının dağılımıu1+u2(u1,u2 ), aynı zamanda bağımsızçünküy(0,4]. Burada, bu olmak zorundax>yyekpare eşit şekildefu1+u2(x)=-1
fu1+u2(x)=+f1(xy)f2(y)dy=14041xyxylny4dy,
y(0,4]x>yŞimdi Mathematica'ya yerleştiriyorum ve bunu elde ediyorumfu1+u2(x)=1
fu1+u2(x)=140x1xyxylny4dy.
fu1+u2(x)=14[x+xlnx42x(2+lnx)].

Her biri 10 6 rakamdan oluşan dört bağımsız seti yaptım ve bir histogram çizdim.a,b,c,d106 :(ad)2+4bc

enter image description here

ve bir parça f çizdi:fu1+u2(x)

enter image description here

Genellikle, grafik histograma benzer, ancak aralıkta (0,5) çoğu negatiftir (kök 2.27034'tür). Ve pozitif kısmın integrali .0.77

Hata nerede? Ya da nerede bir şey eksik?

EDIT: PDF'yi göstermek için histogramı ölçeklendirdim.

enter image description here

DÜZENLEME 2: Bence akıl yürütmemdeki sorunun entegrasyon sınırlarında nerede olduğunu biliyorum. Çünkü ve x - y ( 0 , 1 ]) basitçe x 0y(0,4]xy(0,1]0x grafiğini göstermektedir içinde entegre olması bölgesi.

enter image description here

Bu araçlar ben için y ( 0 , 1 ] (diğer bir deyişle zaman parçası yüzden f doğru), x x - 1 de y ( 1 , 4 ] ve 4 x - 1 de y ( 4 , 5 ] . Ne yazık ki, Mathematica son iki integraller hesaplamak için başarısız (hayali birim çıktıda var tarafından iyi, bu ikinci hesaplamak olmadığını ganimeti herşey ...).0xy(0,1]fx1xy(1,4]x14y(4,5]

DÜZENLEME 3: Mathematica'nın son üç integrali aşağıdaki kodla hesapladığı anlaşılıyor:

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1}, Assumptions -> 1 <= u2 <= 3 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4}, Assumptions -> 4 <= u2 <= 4 && u1 > 0]

ki bu doğru bir cevap verir :)


2
Cevabınızın mantıklı olup olmadığını simülasyon ile kontrol etmeyi sevmişsinizdir. Sorununuz bir hata yaptığınızı bilmenizdir , ancak nerede olduğunu tam olarak göremezsiniz. Hatanın nerede olduğunu gidermek için yönteminizin her aşamasını kontrol edebileceğinizi düşündünüz mü ? Örneğin, hata yatar ? Hesaplanan PDF'nizi, son yanıtınızda olduğu gibi benzetilmiş sonuçlara göre kontrol edebilirsiniz. F 2 için aynen . Eğer f 1 ve f 2 hem doğru onları birleştirirken, o zaman hata yapmış olabiliriz. Bu tür adım adım kontrol, yanlış yaptığınız yeri saptamanıza olanak tanır!f1(u1)f2f1f2
Silverfish

İlk denememi attım ve sıfırdan yeniden hesapladım. İnanıyorum ve f 2 el çarpma benim ilk zorundaydı rağmen, doğru f 1 2 oranında bu birliğe normalize olması. Ama bu sadece yüksekliği değiştiriyor ve neden negatif f olduğumu açıklamıyor . f1f2f1f
corey979

When generating such histograms to compare to calculated algebraic quantities, scale the histogram to a be valid density (and superimpose them if you can). Do a similar check for your f1 and f2 to make sure you have those right; if they're right (I didn't see any good reason to suspect them yet, but its best to double check), then the problem must be later.
Glen_b -Reinstate Monica

Yanıtlar:


19

Often it helps to use cumulative distribution functions.

First,

F(x)=Pr((ad)2x)=Pr(|ad|x)=1(1x)2=2xx.

Next,

G(y)=Pr(4bcy)=Pr(bcy4)=0y/4dt+y/41ydt4t=y4(1log(y4)).

Let δ range between the smallest (0) and largest (5) possible values of (ad)2+4bc. Writing x=(ad)2 with CDF F and y=4bc with PDF g=G, we need to compute

H(δ)=Pr((ad)2+4bcδ)=Pr(xδy)=04F(δy)g(y)dy.

We can expect this to be nasty--the uniform distribution PDF is discontinuous and thus ought to produce breaks in the definition of H--so it is somewhat amazing that Mathematica obtains a closed form (which I will not reproduce here). Differentiating it with respect to δ gives the desired density. It is defined piecewise within three intervals. In 0<δ<1,

H(δ)=h(δ)=18(8δ+δ((2+log(16)))+2(δ2δ)log(δ)).

In 1<δ<4,

h(δ)=14((δ+1)log(δ1)+δlog(δ)4δcoth1(δ)+3+log(4)).

And in 4<δ<5,

h(δ)=14(δ4δ4+(δ+1)log(4δ1)+4δtanh1((δ4)δδδδ4)1).

Figure

This figure overlays a plot of h on a histogram of 106 iid realizations of (ad)2+4bc. The two are almost indistinguishable, suggesting the correctness of the formula for h.


The following is a nearly mindless, brute-force Mathematica solution. It automates practically everything about the calculation. For instance, it will even compute the range of the resulting variable:

ClearAll[ a, b, c, d, ff, gg, hh, g, h, x, y, z, zMin, zMax, assumptions];
assumptions = 0 <= a <= 1 && 0 <= b <= 1 && 0 <= c <= 1 && 0 <= d <= 1; 
zMax = First@Maximize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];
zMin = First@Minimize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];

Here is all the integration and differentiation. (Be patient; computing H takes a couple of minutes.)

ff[x_] := Evaluate@FullSimplify@Integrate[Boole[(a - d)^2 <= x], {a, 0, 1}, {d, 0, 1}];
gg[y_] := Evaluate@FullSimplify@Integrate[Boole[4 b c <= y], {b, 0, 1}, {c, 0, 1}];
g[y_]  := Evaluate@FullSimplify@D[gg[y], y];
hh[z_] := Evaluate@FullSimplify@Integrate[ff[-y + z] g[y], {y, 0, 4}, 
          Assumptions -> zMin <= z <= zMax];
h[z_]  :=  Evaluate@FullSimplify@D[hh[z], z];

Finally, a simulation and comparison to the graph of h:

x = RandomReal[{0, 1}, {4, 10^6}];
x = (x[[1, All]] - x[[4, All]])^2 + 4 x[[2, All]] x[[3, All]];
Show[Histogram[x, {.1}, "PDF"], 
 Plot[h[z], {z, zMin, zMax}, Exclusions -> {1, 4}], 
 AxesLabel -> {"\[Delta]", "Density"}, BaseStyle -> Medium, 
 Ticks -> {{{0, "0"}, {1, "1"}, {4, "4"}, {5, "5"}}, Automatic}]

8
(+1), especially for reminding people that, instead say of density convolutions, "Often it helps to use cumulative distribution functions" -especially when they have such a simple form as here. And you were damn quick, also.
Alecos Papadopoulos

That looks like a neat solution that I'd love to accept - right after I understand it. I'm more a calculus man than a probabilist; at this moment I have three questions: i) how did you use the CDF to get F(x) and G(y), ii) why there's F and g under the integral for H, and iii) how do you from its form that the solution result will be piecewise?
corey979

(1) F and G are the CDFs. They are computed from the definition of a CDF, as indicated by the first equalities following their first appearances. The details should be apparent in the code I have inserted. (2) This is the convolution formula for a sum (more fully explained in a similar calculation at stats.stackexchange.com/a/144237). (3) I inserted a link to another thread about properties of uniform distributions.
whuber

7

Like the OP and whuber, I would use independence to break this up into simpler problems:

Let X=(ad)2. Then the pdf of X, say f(x) is:

enter image description here

Let Y=4bc. Then the pdf of Y, say g(y) is:

enter image description here

The problem reduces to now finding the pdf of X+Y. There may be many ways of doing this, but the simplest for me is to use a function called TransformSum from the current developmental version of mathStatica. Unfortunately, this is not available in a public release at the present time, but here is the input:

TransformSum[{f,g}, z]

which returns the pdf of Z=X+Y as the piecewise function:

enter image description here

Here is a plot of the pdf just derived, say h(z):

enter image description here

Quick Monte Carlo check

The following diagram compares an empirical Monte Carlo approximation of the pdf (squiggly blue) to the theoretical pdf derived above (red dashed). Looks fine.

enter image description here

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.