İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

1
Sıfır korelasyonlu karma modeller teorik olarak ne zaman ses çıkar?
Aşağıdaki karma teklif, karma etki modellemesi alanındaki liderlerden, rastgele etkiler ('ZCP' modelleri) arasındaki sıfır korelasyonlu modellerde koordinatın kaymasının model tahminlerini değiştirdiğini iddia ediyor. Ancak, birileri iddialarını detaylandırabilir veya daha fazla haklı gösterebilir mi? Söz konusu ifadeler Bates ve arkadaşlarının 2015 lme4, lme4 Kullanarak Doğrusal Karışık Etki Modellerini Takma , 7. …

4
Değişken önem dereceleri ne için faydalıdır?
Değişken önem sıralaması söz konusu olduğunda (her çeşit çok değişkenli modeller bağlamında) bir nihilist oldum . Genelde, çalışmalarım sırasında, başka bir ekibin değişken öneme sahip bir sıralama yapmasına ya da kendi işimden değişen bir öneme sahip bir grup oluşturmasına yardımcı olmam isteniyor. Bu taleplere cevap olarak aşağıdaki soruları soruyorum Bu …



2
Lognormal dağılımın moment tahmincisi yanlılığı
Bir lognormal dağılımın örneklemesini ve örneklemesini ve anları anlarını iki yöntemle tahmin etmeye çalışan bazı sayısal deneyler yapıyorum :X∼LN(μ,σ)X∼LN(μ,σ)X\sim\mathcal{LN}(\mu, \sigma)E[Xn]E[Xn]\mathbb{E}[X^n] örnek ortalamasına bakmakXnXnX^n Tahmin ve için örnek bir yöntem kullanarak , ve daha sonra bir lognormal dağılım için, var olduğu gerçeğini kullanarak .μμ\muσ2σ2\sigma^2log(X),log2(X)log⁡(X),log2⁡(X)\log(X), \log^2(X)E[Xn]=exp(nμ+(nσ)2/2)E[Xn]=exp⁡(nμ+(nσ)2/2)\mathbb{E}[X^n]=\exp(n \mu + (n \sigma)^2/2) Soru şudur …

8
Olasılıklardaki hata çubuklarının bir anlamı var mı?
İnsanlar sık ​​sık bazı olayların% 50-60 yaşanma şansı olduğunu söylüyor. Bazen insanların olasılık atamalarında açık hata çubukları verdiğini bile görüyorum. Bu ifadelerin herhangi bir anlamı var mı ya da sadece doğası gereği bilinmeyen bir şey için belirli bir sayı seçerken dilbilimsel bir rahatsızlık duygusu mu var?

1
Sanat akım öğrenme öğrenme
Son zamanlarda büyük veri kümeleriyle çalışıyorum ve çok sayıda akış yöntemi buldum. Birkaç isim: Düzenli Lider ve Ayna İnişini Takip Etme: Eşdeğerlik Teoremleri ve L1 Düzenlemesi ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) Akışlı Öğrenme: Bir Geçişli SVM'ler ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) Pegasos: SVM için Primal Tahmini Alt GrAdient SOlver http://ttic.uchicago.edu/~nati/Publications/PegasosMPB.pdf veya burada: SVM her …

0
Jaynes '
Jaynes'in "Olasılık Teorisi: Bilim Mantığı" kitabında , , bu örneklemesinde yardımcı olduğu dağılımları fikrini tanıttığı " ApApA_p dağılımı ve ardışık kuralı " başlıklı bir bölümü (Ch 18) vardır :ApApA_p [...] Bunu görmek için yeni bilgi almanın etkisini düşünün. Madeni parayı beş kez attığımızı ve her seferinde kuyrukların geldiğini varsayalım. Bir …

1
T-testinin ölümüne dair raporlar fazlasıyla abartılmış mı?
Özgeçmiş tüm zamanların klasiklerini okuyarak netleştirmek istediğim bir ifadeyle karşılaştım. Bu yazı ve sorum şu kapanış sözlerine atıfta bulunuyor: "Yeni verdiğim bilgilerin tamamının biraz eski olduğunu not etmek zorundayım; şimdi bilgisayarlarımız olduğu için t testlerinden daha iyisini yapabiliriz. Frank'in dediği gibi Muhtemelen Wilcoxon testlerini bir t testi yaptırmanız öğretilen her …

5
Maksimum Olabilirlik Tahmini - birçok durumda taraflı olmasına rağmen neden kullanılır?
Maksimum olabilirlik tahmini genellikle taraflı tahmin edicilere yol açar (örneğin, örnek varyans için olan tahmin Gauss dağılımı için önyargılıdır). Sonra ne bu kadar popüler kılan? Tam olarak neden bu kadar çok kullanılıyor? Ayrıca, onu alternatif yaklaşımdan daha iyi yapan şey nedir? Ayrıca, Gaussian için MLE tahmincisinin basit bir ölçeklemesinin onu …

2
Genelleştirilmiş doğrusal (karışık) modeller için teşhis (özellikle artıklar)
Şu anda zor sayım verileri için doğru modeli bulmakta zorlanıyorum (bağımlı değişken). Gaussian ya da negatif binomial gibi çeşitli aileleri olan genelleştirilmiş lineer karışık efekt modellerinin yanı sıra lmerve lme4(log kaydı ile ) gibi çeşitli farklı modelleri (veri çeşitlerim için karma efekt modelleri gerekli) denedim . Ancak, ortaya çıkan uyumun …


4
Bir arsada birçok değişkeni görselleştirme
Belirli değişkenlerin (~ 15) değerlerinin zaman içinde nasıl değiştiğini göstermek isterim, ancak değişkenlerin her yıl içinde birbirlerinden nasıl farklılaştığını da göstermek isterim. Böylece bu arsa oluşturdum: Fakat renk şemasını değiştirirken veya farklı çizgi / şekil türleri eklerken bile, bu karışık görünmektedir. Bu tür verileri görselleştirmenin daha iyi bir yolu var …

4
Çapraz doğrulama sonrasında 'test' veri setini nasıl kullanırsınız?
Bazı konferanslar ve öğreticiler eğitim, doğrulama ve test: Gördüğüm, bunlar üç bölüme verilerinizi bölmek düşündürmektedir. Ancak test veri setinin nasıl kullanılması gerektiği ve bu yaklaşımın tüm veri setindeki çapraz doğrulamadan nasıl daha iyi olduğu açık değildir. Diyelim ki verilerimizin% 20'sini bir test seti olarak kaydettik. Sonra gerisini alırız, onu katlara …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.