Benzersiz bir çözüm yok
Bazı ek varsayımlar yapmadıkça, gerçek ayrık olasılık dağılımının kurtarılabileceğini düşünmüyorum. Durumunuz temel olarak marjinallerden ortak dağılımı kurtarma sorunudur. Bazen sektörde, örneğin finansal risk yönetimi, ancak genellikle sürekli dağılımlar için kopulalar kullanılarak çözülür .
Varlık, Bağımsız, AS 205
Varlık probleminde , bir hücrede birden fazla bombaya izin verilmez. Yine, özel bağımsızlık durumu için, nispeten etkili bir hesaplama çözümü vardır.
Eğer FORTRAN biliyorsanız, kullanabilirsiniz bu kodu Ian Saunders, Algoritma AS 205: R sayımı Tekrarlanan Sıra Toplamları, Uygulamalı İstatistik, Cilt 33, Sayı 3, 1984, sayfa 340-352 ile C Tabloları x uygular AS 205 Algoritması söyledi. @Glen_B'nin bahsettiği Panefield algo ile ilgilidir.
Bu algo tüm varlık tablolarını numaralandırır, yani bir alanda sadece bir bombanın olduğu tüm olası tablolardan geçer. Ayrıca çokluğu, yani aynı görünen birden çok tabloyu hesaplar ve bazı olasılıkları hesaplar (ilgilendiklerinizi değil). Bu algoritma ile tüm numaralandırmayı daha önce olduğundan daha hızlı çalıştırabilirsiniz.
Varlık, bağımsız değil
AS 205 algoritması, satırların ve sütunların bağımsız olmadığı bir duruma uygulanabilir. Bu durumda, numaralandırma mantığı tarafından oluşturulan her tabloya farklı ağırlıklar uygulamanız gerekir. Ağırlık, bombaların yerleştirilme sürecine bağlı olacaktır.
Sayılar, bağımsızlık
Sayım sorun verir Birden fazla elbette, bir hücreye konur bomba. Bağımsız sıralar ve sayım problemi sütunlarının özel durumu kolaydır: Pjben= Pben× Pj
burada Pben ve Pj , satır ve sütunların marjinalleridir. Örneğin, sıra P6= 3 / 15 = 0.2 ve sütun P3= 3 / 15 = 0.2 , bu nedenle bir bomba satır 6'da olma olasılığı ve sütun 3,P36= 0,04 . Aslında bu dağılımı ilk tablonuzda ürettiniz.
Sayımlar, Bağımsız değil, Ayrık Copulalar
Satır ve sütunların bağımsız olmadığı sayma problemini çözmek için ayrık kopulalar uygulayabiliriz. Sorunları var: benzersiz değiller. Yine de onları işe yaramaz yapmaz. Bu yüzden ayrık kopulaları uygulamayı denerdim. Bunlara Genest, C. ve J. Nešlehová'da (2007) iyi bir genel bakış bulabilirsiniz . Sayma verileri için copulas üzerine bir astar. Astin Bull. 37 (2), 475-515.
Kopulalar genellikle bağımlılığı açıkça indüklemelerine veya veriler mevcut olduğunda verilerden tahmin etmelerine izin verdikleri için özellikle yararlı olabilir. Bombaları yerleştirirken satır ve sütunların bağımlılığını kastediyorum. Örneğin, bombanın ilk sıradan biri olması durumunda, ilk sütundan biri olması daha olasıdır.
Misal
θC( u , v ) = ( u- θ+ u- θ- 1 )- 1 / θ
θ
Bağımsız
θ = 0.000001
Sütun 5'te ikinci sıra olasılığının ilk sıradan iki kat daha yüksek olasılığa sahip olduğunu görebilirsiniz. Bu, sorunuzda ima ettiğinizin aksine yanlış değil. Tüm olasılıklar, elbette, panellerdeki marjinaller frekanslarla eşleştiğinde% 100'e kadar ekler. Örneğin, alt paneldeki sütun 5, beklendiği gibi toplam 15'ten 5 bombaya karşılık gelen 1/3 değerini gösterir.
Pozitif korelasyon
θ = 10
Negatif korelasyon
θ = - 0.2
Elbette tüm olasılıkların% 100'e kadar çıktığını görebilirsiniz. Ayrıca, bağımlılığın PMF'nin şeklini nasıl etkilediğini görebilirsiniz. Pozitif bağımlılık (korelasyon) için diyagonal üzerinde en yüksek PMF elde edilirken, negatif bağımlılık için diyagonal değildir