Uzamsal verilere uyumu dağıtma


10

Bazı istatistiklere özel yardım bulmak için sorumu mathoverflow'dan yayınlayın .

Negatif olmayan değerlerle iki boyuta güzel bir şekilde yansıyan veri üreten fiziksel bir süreç üzerinde çalışıyorum. Her işlemin - y noktalarının (yansıtılan) bir izi vardır - aşağıdaki resme bakın.xy

Örnek pistler mavidir, zahmetli bir pist elle yeşil olarak çizilmiştir ve endişe verici bir bölge kırmızı olarak çizilmiştir: İzler ve endişe duyulan bölge

Her parça bağımsız bir deneyin sonucudur. Birkaç yıl boyunca yirmi milyon deney yapıldı, ancak bunlardan sadece iki bin tanesi pist olarak çizdiğimiz özelliği sergiliyor. Biz sadece bir parkur üreten deneylerle ilgileniyoruz, bu yüzden veri setimiz (yaklaşık) iki bin parkur.

1104

İlgili bölgeye keyfi bir yol girme olasılığını nasıl hesaplayabiliriz?

İlgili bölgeye giren parçaların ne sıklıkta üretildiğini görmek için yeterince hızlı deney yapmak mümkün değildir, bu nedenle mevcut verilerden tahmin yapmamız gerekir.

xy200

Her bir pistten endişe duyulan bölgeye minimum mesafeyi koyduk, ancak bunun haklı bir sonuç verdiğine ikna olmadık.

1) Ekstralasyon için bu tür verilere bir dağıtım yapmanın bilinen bir yolu var mı?

-veya-

2) Bu verileri, parça oluşturmak için bir model oluşturmak amacıyla kullanmanın açık bir yolu var mı? Örneğin, ana bileşen analizini izler üzerinde geniş bir alanda noktalar olarak kullanın, daha sonra bu bileşenlere yansıtılan izlere bir dağılım (Pearson?) Takın.


1
Belirli bir süreç hakkında daha fazla bilgi vermemeliyim, ancak verileri nasıl toplandığını konuşmak için soruyu güncelleyeceğim.
Jeff Snider

1
Daha somut olmaya çalışmak için dili güncelledim. Açık bir üst kat penceresine çakıl attığımızı ve sadece pencereden geçen çakılların içerideki zeminde nasıl zıpladığını düşünün. Milyonlarca çakıl taşı attık ve yaklaşık 2000 kişi pencereden geçti. Bir çakıl pencereden geçtiğinde, zemin üzerindeki ilerlemesinin bir parçasını çizeriz. Bir çakıl pencereden geçtiği için, endişe duyduğu bölgeden geçme olasılığını tahmin etmek istiyoruz.
Jeff Snider

Yanıtlar:


1

Parça oluşumunu simüle etmek ve daha sonra kırmızı bölgeye kaç parçanın düştüğünü görmek için bir Monte Carlo simülasyonu yapmak istediğiniz gibi görünüyor. Bunu yapmak için, önce hatları bir yöne ve diğeri bir noktadan diğerine o yoldaki mesafeyi veren iki işleve dönüştürürdüm. Şimdi bu iki fonksiyonla ilişkili olasılık dağılımlarını inceleyebilirsiniz. Örneğin, kat edilen mesafenin belirli bir dağılımı izlediğini görebilirsiniz (dağılımın zaman içinde değişmemesine dikkat edin). Değişkenlerden biri zamanla değişirse, zaman serisi analizine girmeniz gerekir (benim alanım değil, özür dilerim).

Akla gelen bir başka düşünce, xy'deki hareket yönünün çoğu parçanın kademeli olarak değiştiği için, pistlerin yönündeki zamana karşı yön değişikliğini daha iyi inceleyebilirsiniz.

Ayrıca, belirli bir yön ile belirli bir xy koordinatından başlayan bir parkur olasılığını da tahmin etmeniz gerekir. Ortaya çıkan PDF'yi düzeltmek için çekirdek yoğunluğu tahminini kullanmayı düşünebilirsiniz ya da analitik bir modelin bulunduğu bir dağılımı izliyorsa, bu dağılımı verilere uyacak şekilde beklenti maksimizasyonu kullanılabilir.

Monte Carlo simülasyonu, parçaların şekillerini simüle etmek için bu dağılımlardan rastgele örnekler çekecektir. Sonra çok sayıda parkuru simüle etmeli ve bu parkurların kırmızı bölgeden ne sıklıkla geçtiğini görmelisiniz. Bu binlerce veya milyonlarca parça olabilir, daha fazla parça ekledikçe dağıtımın ne zaman durduğunu görmek için denemeniz gerekir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.