Değişmeden bağımsız rasgele örneklerin kesişiminin kardinalitesinin dağılımı nedir?


10

S ile bazı dizi elemanlar ve az pozitif tamsayılar, sabit ya da eşit olan .nNa1,a2,...,amn

Unsurları ile eşit olasılıkla olmak, örnekleri ayrı ve bağımsız olarak çekilir olan boyutu olan, değiştirmeden sırasıyla.SmL1,L2,...,LmSbir1,bir2,...,birm

Numunelerin kesişiminin esas değerigenel olarak desteğine eşit , ancak hangi dağılımı izliyor?|L1L2 ... Lm|{0,1,...,min{bir1,bir2,...,birm}}


Size yinelemeli olarak hesaplamak için bir tarif verebilirim, ancak kapalı bir form çözümünün farkında değilim. Bu yeterli mi, yoksa a1,,am ve n olarak verilen dağıtım işlevinin açık bir ifadesini mi istiyorsunuz n?
Bridgeburners

@Bridgeburners Bir tarif güzel olurdu, en azından bu soruna saldıracak ve ilgili bir yöntem / yol sağlayacaktır.
llrs

Yanıtlar:


3

İşte başka bir yaklaşım, özyineleme içermeyen bir yaklaşım. Yine de uzunlukları parametrelere bağlı olan toplamları ve ürünleri kullanıyor. Önce ifadeyi vereceğim, sonra açıklayacağım.

Biz var

P(|L1L2Lm|=k)=(nk)i=1n(nai)j=0min(a1,,am)k(1)j(nkj)l=1n(njkaljk).

DÜZENLEME: Tüm bunları yazmanın sonunda, binom katsayılarını hipergeometrik olasılıklar ve trinomial katsayılarla birleştirerek yukarıdaki ifadeyi biraz birleştirebileceğimizi fark ettim. Değeri ne olursa olsun, revize edilen ifade Burada , çekimlerinin, başarı durumlarına sahip boyutundaki bir popülasyondan alındığı hipergeometrik rastgele bir değişkendir .Hip(n,j

j=0min(a1,,am)k(1)j(nj,k,n-j-k)Πl=1nP(Hyp(n,j+k,birl)=j+k).
a l n j + kHyp(n,j+k,birl)birlnj+k

türetme

Kombinatoryal argümanların izlenmesini biraz daha kolay hale getirmek için bazı gösterimler alalım (umarım). Boyunca, ve sabit olarak kabul edilir. Biz kullanacağız sipariş toplama göstermek için -tuples , her yerde , tatmina 1 , , a m C ( I )Sbir1,...,birmC(ben)( L 1 , , L m ) L iSm(L1,,Lm)LbenS

  • |Lben|=birben ; ve
  • L1Lm=I .

Biz de kullanacağız biz gerektirir dışında eş bir koleksiyon için yerine eşitlik. L 1 L mIC(I)L1LmI

Önemli bir gözlem, in sayılması nispeten kolaydır. Bunun nedeni, , tüm için ile eşdeğer olması , bir anlamda farklı değerleri arasındaki etkileşimleri kaldırır . Her , gereksinimi karşılayan sayısı , biz inşa beri böyle bir alt kümesi seçerek boyutuve daha sonra unioning . Bunu takip eder L 1 L mI L iIiiiC(I)L1LmILiIiii( | S | - | I |LiLiSBenai-| I| I| C(I)| =n(|S||I|ai|I|)LiSIai|I|I

|C(I)|=i=1n(|S||I|ai|I|).

Şimdi orijinal olasılıkımız ile şu şekilde ifade edilebilir : P ( | L 1L 2L m | = k )C

P(|L1L2Lm|=k)=I:|I|=k|C(I)|all IS|C(I)|.

Burada hemen iki basitleştirme yapabiliriz. İlk olarak, payda İkinci olarak, bir permütasyon argümanısadece kardinaliteden bağlıdır. Olduğundan alt kümeleri kardinalitesi sahip , o izler ; burada , kardinaliteye sahip keyfi, sabit bir altkümesidir| C(I)| I| I| (n

|C()|=i=1n(|S|ai)=i=1n(nai).
|C(I)|I|I| SkI:| I| =k| C(I)| = ( n(nk)SkI0Sk
I:|I|=k|C(I)|=(nk)|C(I0)|,
I0Sk .

Geri adım attığımızda, sorunu

|C(I0)|=j=0min(a1,,am)k(1)j(nkj)l=1n(njkaljk).

Let ayrı alt-gruplar olabilir tam bir eleman eklenerek oluşturulan . Sonra (bu, sadece eğer söylüyor , daha sonra içerir aynı zamanda herhangi bir ek eleman içermez.) Şimdi dönüştürülmüş ettik a -counting sorunu biz daha nasıl işleneceğini biliyor -counting sorun. Daha spesifik olarak, S I 0 ° C ( I 0 ) = C ' ( I 0 ) ( n - k i = 1 ° C ' ( J i ) ) . L 1L m = I 0 L C| C ( I 0 ) |J1,...,Jn-kSben0

C(ben0)=C'(ben0)(ben=1n-kC'(Jben)).
L1Lm=ben0 I 0 CL1Lmben0CC'
|C(ben0)|=|C'(ben0)|-|ben=1n-kC'(Jben)|=Πl=1n(n-kbirl-k)-|ben=1n-kC'(Jben)|.

Yukarıdaki birleşim ifadesinin boyutunu ele almak için içerme-hariç tutma uygulayabiliriz. Buradaki önemli ilişki, herhangi bir boş olmayan , Bunun nedeni, eğer bir dizi içeriyorsa, aynı zamanda birleşimlerini de içerir. Ayrıca boyutunun. bu nedenle ben{1,...,n-k}

benbenC'(Jben)=C'(benbenJben).
L1LmJbenbenbenJben|ben0|+|ben|=k+|ben|
|ben=1n-kC'(Jben)|=Σben{1,...,n-k}(-1)|ben|-1|benbenC'(Jben)|=Σj=1n-kΣben:|ben|=j(-1)j-1Πl=1n(n-j-kbirl-j-k)=Σj=1n-k(-1)j-1(n-kj)Πl=1n(n-j-kbirl-j-k).
( Tüm için olmadığı sürece, binom katsayılarının çarpımı sıfır olduğu için burada değerlerini kısıtlayabiliriz , yani .)jjbirl-kljmin(bir1,...,birm)-k

Son olarak, sonunda ifadeyiyukarıda ve toplamı birleştirerek, talep edildiği gibi.|C(ben0)|

|C(ben0)|=Σj=0min(bir1,...,birm)-k(-1)j(n-kj)Πl=1n(n-j-kbirl-j-k)

Tüm çaba ve çözüm için + 1'ledim, ancak bunların çoğunu (ve diğer cevabı) anlamak için matematiklerimi cilalamam gerekecek. Teşekkürler
llrs

4

Bunu çözmenin analitik bir yolunun farkında değilim, ama sonucu hesaplamak için özyinelemeli bir yol.

For sen seçiyorsun dışına elemanlarını önce seçilmiştir olan. Seçme olasılığı ile kesiştiği bu elemanlar ikinci berabere hipergeometrik dağılımı aşağıdaki şekilde verilir:m=2bir2n, bir1kmin{bir1,bir2}L1

P(k|n,bir1,bir2)=(bir1k)(n-bir1bir2-k)(nbir2).

olarak bulmak için aynı mantığı kullanabiliriz burada , üç örneğin kesişiminin . Sonra,b2.P(b3=k|n,b2,bir3),b3

P(b3=k)=Σl=0min(bir1,bir2)P(b3=k|n,b2=l,bir3)P(b2=l|n,bir1,bir2).

her için bunu bulun . İkinci hesaplama, çünkü sayısal zor değildir sadece daha önceki hesaplamada ve sonucudur bir çağrı olduğu hipergeometrik dağılım.k{0,1,2,...,min(bir1,bir2,bir3)}P(b2=l|n,bir1,bir2)P(b3=k|n,b2=l,bir3)

Genel olarak, bulmak için aşağıdaki özyinelemeli formülleri uygulayabilirsiniz: için ve bu sadece demekP(bm)

P(bben=k)=Σl=0min(bir1,bir2,...,birben-1)P(bben=k|n,bben-1=l,birben)P(bben-1=l),
P(bben=k|n,bben-1=l,birben)=(lk)(n-lbirben-k)(nbirben),
ben{2,3,...,m},
P(b1)=δbir1b1,
b1=bir1.

İşte R'de:

hypergeom <- function(k, n, K, N) choose(K, k) * choose(N-K, n-k) / choose(N, n)

#recursive function for getting P(b_i) given P(b_{i-1})
PNext <- function(n, PPrev, ai, upperBound) {
  l <- seq(0, upperBound, by=1)
  newUpperBound <- min(ai, upperBound)
  kVals <- seq(0, newUpperBound, by=1)
  PConditional <- lapply(kVals, function(k) {
    hypergeom(k, ai, l, n)
  })
  PMarginal <- unlist(lapply(PConditional, function(p) sum(p * PPrev) ))
  PMarginal
}

#loop for solving P(b_m)
P <- function(n, A, m) {
  P1 <- c(rep(0, A[1]), 1)
  if (m==1) {
    return(P1)
  } else {
    upperBound <- A[1]
    P <- P1
    for (i in 2:m) {
      P <- PNext(n, P, A[i], upperBound)
      upperBound <- min(A[i], upperBound)
    }
    return(P)
  }
}

#Example
n <- 10
m <- 5
A <- sample(4:8, m, replace=TRUE)
#[1] 6 8 8 8 5

round(P(n, A, m), 4)
#[1] 0.1106 0.3865 0.3716 0.1191 0.0119 0.0003
#These are the probabilities ordered from 0 to 5, which is the minimum of A

Çözümünüz ve kodunuz için teşekkürler. Ödül vermeden önce (eğer gelirlerse) diğer cevap yaklaşımlarını bekliyorum.
llrs
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.