İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap


4
Küçük
Bazı testler için R, 2.22 ⋅ 10 - 16 p-değeri hesaplamalarında daha düşük bir sınır vardır . Neden bu sayı olduğundan emin değilim, eğer bunun için iyi bir neden varsa veya sadece isteğe bağlıysa. Pek çok başka istatistik paketi de geçerli , bu yüzden bu çok daha yüksek bir hassasiyet …



5
Jeffrey'ler neden önceden faydalıdır?
Jeffrey’in önceliğinin yeniden parametreleştirme altında değişmez olduğunu biliyorum. Ancak anlamadığım şey, bu özelliğin neden istendiği. Değişkenlerin değişimi altında neden önceliğin değişmesini istemiyorsunuz?
61 bayesian  prior 

10
“Bilim adamları istatistiksel öneme sahip olarak yükseliş” ne demek? (Doğada Yorum Yap)
Doğa Bilimcilerinde Yorumun başlığı, istatistiksel öneme sahip olarak yükselir : Valentin Amrhein, Sander Grönland, Blake McShane ve 800'den fazla imzacı, yüksek taleplerin sona ermesine ve muhtemel önemli etkilerin reddedilmesine neden olmaktadır. ve sonra gibi ifadeler içerir: Yine, P değerleri, güven aralıkları veya diğer istatistiksel önlemlerin yasaklanmasını savunmuyoruz - yalnızca kategorik …

2
Olabilirlik oranı vs Bayes Faktörü
Belli bir fenomen için / aleyhte nesnel kanıtları temsil etmek için olasılık oranlarının kullanımıyla ilgili olarak evangelistim. Bununla birlikte, geçenlerde Bayes faktörünün Bayesian yöntemleri bağlamında benzer bir işleve hizmet ettiğini öğrendim (yani önceki öznel nesnel olarak nesnel olarak güncellenmiş bir öznel inanç durumu sağlamak için objektif Bayes faktörü ile birleştirildi). …

2
Neden sadece üç bölüm? (eğitim, doğrulama, test)
Modelleri geniş bir veri kümesine sığdırmaya çalışırken, ortak tavsiye, verileri üç bölüme ayırmaktır: eğitim, doğrulama ve test veri kümesi. Bunun nedeni, modellerin genellikle üç "seviye" parametresine sahip olmalarıdır: ilk "parametre", model sınıfıdır (örneğin, SVM, sinir ağı, rasgele orman), ikinci parametre grubu, "düzenlileştirme" parametreleri veya "hiperparametreler" dir ( örneğin, kement ceza …


5
Büzülme yöntemleri hangi sorunu çözer?
Tatil mevsimi bana İstatistiksel Öğrenme Elemanları ile ateşin yanında kıvrılma fırsatı verdi . (Sık) bir ekonometri perspektifinden gelince, sırt regresyonu, kement ve en düşük açılı regresyon (LAR) gibi büzülme yöntemlerinin kullanımını kavramakta güçlük çekiyorum. Tipik olarak, parametrenin kendilerini tahmin etmesini ve yansızlık veya en azından tutarlılığı elde etmekle ilgilenirim. Büzülme …

9
Normalleştirme ve özellik ölçeklendirme nasıl ve neden çalışır?
Birçok makine öğrenme algoritmasının ortalama iptal ve kovaryans eşitleme ile daha iyi çalıştığını görüyorum. Örneğin, Sinir Ağları daha hızlı birleşme eğilimi gösterir ve K-Means genellikle önceden işlenmiş özelliklerle daha iyi kümeleme sağlar. Bu ön işleme adımlarının ardındaki sezginin performansın yükselmesine neden olduğunu görmüyorum. Biri bunu bana açıklayabilir mi?

7
Çoklu bağımlı değişkenlerle regresyon?
İki veya daha fazla bağımlı değişkenle (çoklu) bir regresyon denkleminin olması mümkün mü? Elbette, her DV için bir tane olmak üzere iki ayrı regresyon denklemi çalıştırabilirsiniz, ancak bu iki DV arasında herhangi bir ilişki yakalayacak gibi görünmüyor mu?
61 regression 

6
Bir dendrogram nerede kesilir?
Hiyerarşik kümeleme bir dendrogram ile temsil edilebilir. Bir dendrogramın belirli bir seviyede kesilmesi bir dizi kümeye neden olur. Başka bir seviyede kesme, başka bir küme kümesi verir. Dendrogramın nerede kesileceğini nasıl seçersiniz? En uygun noktayı düşünebileceğimiz bir şey var mı? Değişen zaman boyunca bir dendrograma bakarsam, aynı noktada mı kesmeliyim?

6
R kullanarak serbest tahmin için standart hatalar
Tahmin için bir LASSO modeli kullanmaya çalışıyorum ve standart hataları tahmin etmem gerekiyor. Elbette birileri bunu yapmak için zaten bir paket yazmıştır. Ancak görebildiğim kadarıyla, bir LASSO kullanarak tahmin yapan CRAN paketlerinin hiçbiri bu tahminler için standart hatalar getirmeyecek. Öyleyse sorum şu: LASSO tahminlerinde standart hataları hesaplamak için bir paket …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.