İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

10
Sık kullanılanlar kimlerdir?
Zaten Bayesanlar ve bir sıklıkçıların Bayesanlar olup olmadığını soran bir iş parçacığımız vardı , fakat doğrudan işverenlerin kim olduğunu soran bir iş parçacığı yok mu? Bu, @whuber tarafından bu konuya bir yorum olarak sorulan bir soru ve cevaplanması için yalvarıyor. Varlar mı (herhangi bir özdeşleşmiş frekansçı var mı)? Belki de …



9
Gelişmiş istatistik kitapları önerisi
Bu sitede tanıtım istatistikleri ve makine öğrenimi ile ilgili kitap önerileri için birkaç konu var, ancak öncelik sırasına göre: maksimum olabilirlik, genelleştirilmiş doğrusal modeller, temel bileşen analizi, doğrusal olmayan modeller dahil olmak üzere gelişmiş istatistikler hakkında bir metin arıyorum . AC Davison'dan İstatistiksel Modeller denedim ama açıkçası 2 bölümden sonra …

3
Lmer'da rastgele etkilerin nasıl belirtildiği ile ilgili sorular
Kısa bir süre önce, kelime farklı bağlamlarda görüntülendiğinde ERP (EEG) ölçülerek tekrarlanan maruz kalmalar (uygulama: 1. gün - 10. gün) boyunca yeni bir kelimenin anlamının nasıl elde edildiğini ölçtüm. Ayrıca bağlamın özelliklerini de kontrol ettim, örneğin yeni kelime anlamını keşfetmede (yüksekden düşüke). Özellikle uygulamanın etkisiyle (günler) ilgileniyorum. Bireysel ERP kayıtları …

6
Lojistik lojistik regresyon alternatifleri
Lojistik regresyon ile aynı görevi yapan birçok algoritma istiyorum. Bu, bazı açıklayıcı değişken (X) ile ikili bir yanıt (Y) için bir tahmin verebilecek algoritmalar / modellerdir. Algoritmayı adlandırdıktan sonra, R'de nasıl uygulanacağını gösterirseniz sevinirim: İşte diğer modellerle güncellenebilecek bir kod: set.seed(55) n <- 100 x <- c(rnorm(n), 1+rnorm(n)) y <- …

7
Hangi sahte-
SPSSLojistik bir regresyon modeli için çıktı aldım . Çıktı, model uyumu için iki önlem olduğunu bildirir Cox & Snellve Nagelkerke. Genel bir kural olarak, bu R2R²R^² ölçümlerinden hangisini model olarak rapor edersiniz? Veya bu uygunluk indekslerinden hangisi, genellikle dergilerde bildirilenlerden biridir? Bazı Geçmiş: Regresyon, bazı çevresel değişkenlerden (örneğin, diklik, bitki …


5
Zaman serisi tahmini için derin öğrenmeyi kullanma
Ben derin öğrenme alanında yeniyim ve benim için ilk adım deeplearning.net sitesinden ilginç makaleler okumak oldu. Derin öğrenme ile ilgili makalelerde, Hinton ve diğerleri çoğunlukla onu görüntü problemlerine uygulamaktan bahseder. Birisi bana cevap vermeye çalışabilir mi, zaman serisi değerlerini (mali, internet trafiği, ...) tahmin etme problemine uygulanabilir mi ve mümkünse …

2
Fisher Bilgi matrisi ve Hessian ile ilişkisi ve standart hatalarla ilgili temel soru
Tamam, bu oldukça basit bir soru, ama biraz kafam karıştı. Tezimde şöyle yazarım: Standart hatalar (gözlemlenen) Fisher Bilgi matrisinin köşegen elemanlarının karekökünün tersini hesaplayarak bulunabilir: -logLI(μ,σ2)=H-1sμ^, σ^2= 1Ben ( μ^, σ^2)------√sμ^,σ^2=1I(μ^,σ^2)\begin{align*} s_{\hat{\mu},\hat{\sigma}^2}=\frac{1}{\sqrt{\mathbf{I}(\hat{\mu},\hat{\sigma}^2)}} \end{align*} R'deki optimizasyon komutu minimize (gözlemlenen) Fisher Bilgi matrisi Hessian'ın tersini hesaplayarak bulunabilir: - logL−log⁡L-\log\mathcal{L}Ben ( μ^, σ^2) …

2
Hareketli ortalama işlemlerin gerçek hayattan örnekleri
Hareketli bir ortalama sıra süreci , yani bazı gerçek hayattan örnekler verebilir misiniz? kısmı vardır , a priori iyi bir model olarak nedenini? En azından benim için otoregressive işlemlerin sezgisel olarak anlaşılması oldukça kolay gözüküyor, MA süreçleri ise ilk bakışta doğal görünmüyor. Ben unutmayın değil (örneğin burada teorik sonuçlarla ilgilenen …

9
R ve Python veri biliminde birbirlerini nasıl tamamlar?
Birçok öğreticide veya kılavuzda anlatı, R ve python'un analiz sürecinin tamamlayıcı bileşenleri olarak bir arada bulunduğunu ima ediyor gibi görünmektedir. Eğitimsiz gözlerime göre, iki dil de aynı şeyi yapıyor gibi görünüyor. Öyleyse benim sorum şu ki, iki dil için gerçekten özel nişler var mı, yoksa birisini mi yoksa diğerini mi …
54 r  python  software 

9
Analizler genellikle laymenler tarafından yapıldığında, bir modelde model varsayımı ve değerlendirmenin önemini abartıyor muyuz?
Sonuç olarak , istatistikler hakkında ne kadar çok şey öğrenirsem, o alanda yayınlanmış makalelere o kadar az güvenirim; Araştırmacıların istatistiklerini yeterince iyi yapmadıklarına inanıyorum. Ben bir meslektenim, tabiri caizse. Biyoloji eğitimi aldım ancak istatistik ya da matematik alanında örgün bir eğitimim yok. R'den zevk alıyorum ve araştırma yaparken uyguladığım yöntemlerin …

5
Farklı cevaplar veren Bayes ve sıkça yaklaşım örnekleri
Not: Ben değilim farkında felsefi Bayes ve frequentist istatistikleri arasındaki farklar. Örneğin, "masanın üzerindeki madalyonun kafalar olma olasılığı nedir" sık sık istatistiklerde bir anlam ifade etmiyor, çünkü zaten ya zaten çıkmış kafalar ya da kuyruklar vardı - bununla ilgili muhtemel bir şey yok. Dolayısıyla sorunun sıkça bir cevabı yok. Ancak, …

3
Özellik seçimi için temel bileşen analizi (PCA) kullanma
Özellik seçimi konusunda yeniyim ve özellik seçimi yapmak için PCA'yı nasıl kullanacağınızı merak ediyordum. PCA, bilgi vermeyen giriş değişkenlerini filtrelemek için kullanabileceğiniz her giriş değişkeni için göreceli bir puan hesaplar mı? Temel olarak, verilerdeki orijinal özellikleri varyansa veya içerdiği bilgi miktarına göre sipariş edebilmek istiyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.