İstatistikler ve Büyük Veri distributions

4

Bir metriğin tüm özelliklerini koruyan bir olasılık mesafesi var mı?

Kullback-Leibler mesafesini incelerken, çok çabuk öğrendiğimiz iki şey vardır; ne bir üçgen eşitsizliğine ne de simetriye, bir metriğin gerekli özelliklerine saygı göstermez. Benim sorum, bir metriğin tüm kısıtlamalarını yerine getiren herhangi bir olasılık yoğunluk fonksiyonu metriği olup olmadığıdır .

13 distributions distance metric

2

Verilen ortalama ve standart sapmanın pozitif sürekli değişkeni için maksimum entropi olasılık yoğunluk fonksiyonu nedir?

Birinci ve ikinci anları göz önüne alındığında, pozitif bir sürekli değişken için maksimum entropi dağılımı nedir ? Örneğin, bir Gauss dağılımı, ortalama ve standart sapması göz önüne alındığında sınırsız bir değişken için maksimum entropi dağılımıdır ve Gamma dağılımı, ortalama değeri ve logaritmasının ortalama değeri göz önüne alındığında, pozitif bir değişken …

13 distributions standard-deviation mean maximum-entropy

4

Ağır kuyruklu dağıtımlar için boxplot eşdeğeri?

Yaklaşık olarak normal olarak dağıtılmış veriler için kutu grafikleri, medyanı ve verilerin yayılmasını ve ayrıca herhangi bir aykırı değerlerin varlığını hızlı bir şekilde görselleştirmenin harika bir yoludur. Bununla birlikte, daha ağır kuyruklu dağılımlar için, uç noktalar IQR'nin sabit faktörünün dışında olduğu tanımlandığından ve çok kuyruklu dağılımlarda elbette çok daha sık …

13 r distributions data-visualization data-transformation ggplot2

2

Var (X) biliniyor, Var (1 / X) nasıl hesaplanır?

Yalnızca , nasıl hesaplayabilirim ?Var(X)Var(X)\mathrm{Var}(X)Var(1X)Var(1X)\mathrm{Var}(\frac{1}{X}) dağılımı hakkında herhangi bir bilgim yok , bu yüzden dönüşümü veya olasılık dağılımını kullanan başka yöntemleri kullanamıyorum .XXXXXX

13 distributions variance data-transformation

1

Örnek ortalama önyükleme yaparken merkezleme gerekli mi?

Örneklemin dağılımının yaklaşık olarak nasıl hesaplanacağını okurken parametrik olmayan önyükleme yöntemiyle karşılaştım. Görünüşe göre nin dağılımı dağılımı ile yaklaşık olabilir , burada , önyükleme örneği. ˉ X ∗ n - ˉ X n ˉ X ∗ nX¯n−μX¯n−μ\bar{X}_n-\muX¯∗n−X¯nX¯n∗−X¯n\bar{X}_n^*-\bar{X}_nX¯∗nX¯n∗\bar{X}_n^* O zaman sorum şu: Merkezlemeye ihtiyacım var mı? Ne için? Değil sadece yaklaşık …

13 distributions bootstrap resampling centering

1

Negatif Türetme. Sıkışmak

Yani, bu soru biraz dahil olmakla birlikte, bunu olabildiğince basit bir şekilde ileriye doğru yapmaya çalıştım. Hedef: Uzun lafın kısası, yok negentropi bir türetme vardır değil yüksek mertebeden cumulant'larının dahil ve bunu elde edilmiştir anlamaya çalışıyorum. Arka plan: (Tüm bunları anlıyorum) Burada bulunan 'Bağımsız Bileşen Analizi' kitabını kendi kendime çalışıyorum …

13 distributions probability pdf entropy

5

Regresyonda yüzdeleri bağımlı değişken olarak tahmin etme

Çalışmamda bağımlı değişken olarak 38 sınavda öğrenci sıralamasında yüzdelerim var. Sıra yüzdesi (bir öğrencinin sıradaki / sınavdaki öğrenci sayısı) ile hesaplanır. Bu bağımlı değişken neredeyse eşit dağılım gösterir ve bazı değişkenlerin bağımlı değişken üzerindeki etkilerini tahmin etmek istiyorum. Hangi regresyon yaklaşımını kullanıyorum?

13 regression distributions

2

Bir veri örneğinin Gamma dağılımı ailesine uyup uymadığını nasıl test edebilirim?

Sürekli rasgele bir değişken X'ten üretilen bir veri örneğim var. Ve R kullanarak çizilen histogramdan, X'in dağılımının belirli bir Gamma dağılımına uyduğunu tahmin ediyorum. Ama bu Gamma dağılımının kesin parametrelerini bilmiyorum. Sorum X'in dağılımının bir Gamma dağılımı ailesine ait olup olmadığını nasıl test edeceğim? Kolmogorov-Smirnov testi, Anderson-Darling testi ve benzeri …

13 distributions hypothesis-testing goodness-of-fit gamma-distribution

3

Bir dağıtımın histogramı ile tanımlanması için yardıma ihtiyacınız var

Belli bir sinyalin kayıtlı genlik maksimumunun örnek popülasyonuna sahibim. Nüfus yaklaşık 15 milyon örnektir. Nüfusun bir histogramını oluşturdum, ancak böyle bir histogramla dağılımı tahmin edemiyorum. EDIT1: Ham örnek değerleri olan dosya burada: ham veri Herkes aşağıdaki histogramla dağılımı tahmin etmeye yardımcı olabilir:

13 distributions histogram

1

Kement için LARS ve koordinat inişi

L1 düzenli lineer regresyonu takmak için koordinat inişine karşı LARS [1] kullanmanın avantajları ve dezavantajları nelerdir? Ben esas olarak performans yönleriyle ilgileniyorum (sorunlarım Nyüzbinlerce ve p<20'de olma eğilimindedir ). Ancak, diğer görüşler de takdir edilecektir. edit: Soruyu gönderdiğimden beri, chl, Friedman ve arkadaşları tarafından koordinat inişinin diğer yöntemlerden önemli ölçüde …

13 regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

4

İki örnek dağılımının kuyruklarının karşılaştırılması

Kabaca sıfır etrafında ortalanmış iki veri setim var, ancak farklı kuyrukları olduğundan şüpheleniyorum. Dağılımın normal bir dağılımla karşılaştırılması için birkaç test biliyorum, ancak doğrudan iki dağılımı karşılaştırmak istiyorum. 2 dağılım kuyruğunun şişmanlığını karşılaştırmak için basit bir test var mı ? Teşekkürler FR

13 hypothesis-testing distributions kurtosis fat-tails

1

İki bağımsız numunenin aynı eğri boşluğu için test edilmesi

Aynı çarpıklığa sahip popülasyonlardan geldikleri sıfır hipotezi için iki bağımsız örneği test etmek için hangi testler mevcuttur? Eğriltmenin sabit bir sayıya eşit olup olmadığı konusunda klasik bir 1-örnek testi vardır (test 6. örnek momentini içerir!); örneklemli bir test için basit bir çeviri var mı? Verilerin çok yüksek anlarını içermeyen teknikler …

13 hypothesis-testing distributions bootstrap moments l-moments

1

Ecdf neden doğrusal enterpolasyon değil bir adım fonksiyonu kullanıyor?

Ampirik CDF fonksiyonları genellikle bir basamak fonksiyonu ile tahmin edilir. Bunun doğrusal bir enterpolasyon kullanarak değil, böyle yapılmasının bir nedeni var mı? Adım fonksiyonunun bizi tercih eden ilginç teorik özellikleri var mı? İşte ikisinin bir örneği: ecdf2 <- function (x) { x <- sort(x) n <- length(x) if (n < …

13 r distributions ecdf

1

GBM kullanarak GBM paketi ve Caret

Model kullanarak ayar yapıyordum caret, ancak gbmpaketi kullanarak modeli yeniden çalıştırıyorum . Anladığım kadarıyla caretpaketin kullandığı gbmve çıktı aynı olmalı. Bununla birlikte, sadece hızlı bir test çalıştırması data(iris), değerlendirme metriği olarak RMSE ve R ^ 2 kullanılarak modelde yaklaşık% 5 tutarsızlık gösterir. Kısmi bağımlılık grafiklerini kullanmak için en iyi model …

13 r caret gbm matrix linear-algebra logistic modeling logit ordered-logit r confidence-interval survival population weibull classification separation hypothesis-testing correlation statistical-significance p-value python r data-visualization r regression multiple-regression chi-squared multivariate-analysis distributions random-variable experiment-design distributions poisson-regression residuals excel time-series garch var survival modeling cox-model interaction r pca normality-assumption

1

Standart normal rasgele değişkenin karesi Pdf [kapalı]

Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 4 yıl önce kapalı . pdf bulmak gerekir nerede bu sorun var . Tek bildiğim dağılımına sahip . ne tür bir dağılımdır ? aynı mı? …

13 self-study distributions normal-distribution pdf

«distributions» etiketlenmiş sorular