«distributions» etiketlenmiş sorular

Dağıtım, olasılıkların veya frekansların matematiksel bir tanımıdır.


2
Verilen ortalama ve standart sapmanın pozitif sürekli değişkeni için maksimum entropi olasılık yoğunluk fonksiyonu nedir?
Birinci ve ikinci anları göz önüne alındığında, pozitif bir sürekli değişken için maksimum entropi dağılımı nedir ? Örneğin, bir Gauss dağılımı, ortalama ve standart sapması göz önüne alındığında sınırsız bir değişken için maksimum entropi dağılımıdır ve Gamma dağılımı, ortalama değeri ve logaritmasının ortalama değeri göz önüne alındığında, pozitif bir değişken …

4
Ağır kuyruklu dağıtımlar için boxplot eşdeğeri?
Yaklaşık olarak normal olarak dağıtılmış veriler için kutu grafikleri, medyanı ve verilerin yayılmasını ve ayrıca herhangi bir aykırı değerlerin varlığını hızlı bir şekilde görselleştirmenin harika bir yoludur. Bununla birlikte, daha ağır kuyruklu dağılımlar için, uç noktalar IQR'nin sabit faktörünün dışında olduğu tanımlandığından ve çok kuyruklu dağılımlarda elbette çok daha sık …


1
Örnek ortalama önyükleme yaparken merkezleme gerekli mi?
Örneklemin dağılımının yaklaşık olarak nasıl hesaplanacağını okurken parametrik olmayan önyükleme yöntemiyle karşılaştım. Görünüşe göre nin dağılımı dağılımı ile yaklaşık olabilir , burada , önyükleme örneği. ˉ X ∗ n - ˉ X n ˉ X ∗ nX¯n−μX¯n−μ\bar{X}_n-\muX¯∗n−X¯nX¯n∗−X¯n\bar{X}_n^*-\bar{X}_nX¯∗nX¯n∗\bar{X}_n^* O zaman sorum şu: Merkezlemeye ihtiyacım var mı? Ne için? Değil sadece yaklaşık …

1
Negatif Türetme. Sıkışmak
Yani, bu soru biraz dahil olmakla birlikte, bunu olabildiğince basit bir şekilde ileriye doğru yapmaya çalıştım. Hedef: Uzun lafın kısası, yok negentropi bir türetme vardır değil yüksek mertebeden cumulant'larının dahil ve bunu elde edilmiştir anlamaya çalışıyorum. Arka plan: (Tüm bunları anlıyorum) Burada bulunan 'Bağımsız Bileşen Analizi' kitabını kendi kendime çalışıyorum …

5
Regresyonda yüzdeleri bağımlı değişken olarak tahmin etme
Çalışmamda bağımlı değişken olarak 38 sınavda öğrenci sıralamasında yüzdelerim var. Sıra yüzdesi (bir öğrencinin sıradaki / sınavdaki öğrenci sayısı) ile hesaplanır. Bu bağımlı değişken neredeyse eşit dağılım gösterir ve bazı değişkenlerin bağımlı değişken üzerindeki etkilerini tahmin etmek istiyorum. Hangi regresyon yaklaşımını kullanıyorum?

2
Bir veri örneğinin Gamma dağılımı ailesine uyup uymadığını nasıl test edebilirim?
Sürekli rasgele bir değişken X'ten üretilen bir veri örneğim var. Ve R kullanarak çizilen histogramdan, X'in dağılımının belirli bir Gamma dağılımına uyduğunu tahmin ediyorum. Ama bu Gamma dağılımının kesin parametrelerini bilmiyorum. Sorum X'in dağılımının bir Gamma dağılımı ailesine ait olup olmadığını nasıl test edeceğim? Kolmogorov-Smirnov testi, Anderson-Darling testi ve benzeri …


1
Kement için LARS ve koordinat inişi
L1 düzenli lineer regresyonu takmak için koordinat inişine karşı LARS [1] kullanmanın avantajları ve dezavantajları nelerdir? Ben esas olarak performans yönleriyle ilgileniyorum (sorunlarım Nyüzbinlerce ve p<20'de olma eğilimindedir ). Ancak, diğer görüşler de takdir edilecektir. edit: Soruyu gönderdiğimden beri, chl, Friedman ve arkadaşları tarafından koordinat inişinin diğer yöntemlerden önemli ölçüde …

4
İki örnek dağılımının kuyruklarının karşılaştırılması
Kabaca sıfır etrafında ortalanmış iki veri setim var, ancak farklı kuyrukları olduğundan şüpheleniyorum. Dağılımın normal bir dağılımla karşılaştırılması için birkaç test biliyorum, ancak doğrudan iki dağılımı karşılaştırmak istiyorum. 2 dağılım kuyruğunun şişmanlığını karşılaştırmak için basit bir test var mı ? Teşekkürler FR

1
İki bağımsız numunenin aynı eğri boşluğu için test edilmesi
Aynı çarpıklığa sahip popülasyonlardan geldikleri sıfır hipotezi için iki bağımsız örneği test etmek için hangi testler mevcuttur? Eğriltmenin sabit bir sayıya eşit olup olmadığı konusunda klasik bir 1-örnek testi vardır (test 6. örnek momentini içerir!); örneklemli bir test için basit bir çeviri var mı? Verilerin çok yüksek anlarını içermeyen teknikler …

1
Ecdf neden doğrusal enterpolasyon değil bir adım fonksiyonu kullanıyor?
Ampirik CDF fonksiyonları genellikle bir basamak fonksiyonu ile tahmin edilir. Bunun doğrusal bir enterpolasyon kullanarak değil, böyle yapılmasının bir nedeni var mı? Adım fonksiyonunun bizi tercih eden ilginç teorik özellikleri var mı? İşte ikisinin bir örneği: ecdf2 <- function (x) { x <- sort(x) n <- length(x) if (n < …
13 r  distributions  ecdf 

1
GBM kullanarak GBM paketi ve Caret
Model kullanarak ayar yapıyordum caret, ancak gbmpaketi kullanarak modeli yeniden çalıştırıyorum . Anladığım kadarıyla caretpaketin kullandığı gbmve çıktı aynı olmalı. Bununla birlikte, sadece hızlı bir test çalıştırması data(iris), değerlendirme metriği olarak RMSE ve R ^ 2 kullanılarak modelde yaklaşık% 5 tutarsızlık gösterir. Kısmi bağımlılık grafiklerini kullanmak için en iyi model …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.