Bazı istatistiklere özel yardım bulmak için sorumu mathoverflow'dan yayınlayın .
Negatif olmayan değerlerle iki boyuta güzel bir şekilde yansıyan veri üreten fiziksel bir süreç üzerinde çalışıyorum. Her işlemin - y noktalarının (yansıtılan) bir izi vardır - aşağıdaki resme bakın.
Örnek pistler mavidir, zahmetli bir pist elle yeşil olarak çizilmiştir ve endişe verici bir bölge kırmızı olarak çizilmiştir:
Her parça bağımsız bir deneyin sonucudur. Birkaç yıl boyunca yirmi milyon deney yapıldı, ancak bunlardan sadece iki bin tanesi pist olarak çizdiğimiz özelliği sergiliyor. Biz sadece bir parkur üreten deneylerle ilgileniyoruz, bu yüzden veri setimiz (yaklaşık) iki bin parkur.
İlgili bölgeye keyfi bir yol girme olasılığını nasıl hesaplayabiliriz?
İlgili bölgeye giren parçaların ne sıklıkta üretildiğini görmek için yeterince hızlı deney yapmak mümkün değildir, bu nedenle mevcut verilerden tahmin yapmamız gerekir.
Her bir pistten endişe duyulan bölgeye minimum mesafeyi koyduk, ancak bunun haklı bir sonuç verdiğine ikna olmadık.
1) Ekstralasyon için bu tür verilere bir dağıtım yapmanın bilinen bir yolu var mı?
-veya-
2) Bu verileri, parça oluşturmak için bir model oluşturmak amacıyla kullanmanın açık bir yolu var mı? Örneğin, ana bileşen analizini izler üzerinde geniş bir alanda noktalar olarak kullanın, daha sonra bu bileşenlere yansıtılan izlere bir dağılım (Pearson?) Takın.