İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

1
Basit bir lojistik regresyon modeli MNIST'de nasıl bir% 92 sınıflandırma doğruluğu elde eder?
MNIST veri setindeki tüm görüntüler ortalanmış olsa da, benzer bir ölçekte ve dönme olmadan yüz yüze olsalar bile, lineer bir modelin bu kadar yüksek bir sınıflandırma doğruluğunu nasıl elde ettiğini gösteren çok önemli bir el yazısı varyasyonu var. Görselleştirebildiğim kadarıyla, önemli el yazısı varyasyonu dikkate alındığında, rakamlar 784 boyutlu bir …

3
Genelleştirilmiş tahmin denklemleri ve karma etki modellerini ne zaman kullanmalı?
Uzun süredir karma etkiler modellerini bir süredir boylamsal verilerle kullanıyorum. AR ilişkilerine lmer'de sığabilmeyi diliyorum (bunu doğru yapamayacağımı düşünüyorum?) Ama bunun çok önemli olduğunu düşünmüyorum, bu yüzden fazla endişelenmiyorum. Genelleştirilmiş tahmin denklemlerine (GEE) rastladım ve ME modellerinden çok daha fazla esneklik sunuyor gibi görünüyorlar. Genel bir soru sorma riski altında, …
63 mixed-model  gee 

9
Bir Bayesian yaklaşımının daha basit, daha pratik veya daha uygun olduğu durumların listesi
İstatistikler içerisinde Bayesliler ile sık görüşmeler arasında birçok tartışma yaşandı. Genelde bunları yerine koyulma buluyorum (her ne kadar öldüğünü düşünüyorum). Öte yandan, konuyla ilgili tamamen pragmatik bir görüşe sahip birkaç kişiyle tanıştım, bazen sıkça bir analiz yapmanın daha uygun olduğunu ve bazen bir Bayesian analizini yürütmenin daha kolay olduğunu söyledim. …

3
Boş hipotez anlamlılık testine karşı argümanlar içeren referanslar?
Son birkaç yılda, bilimde boş hipotez anlamlılık testinin kullanılmasına karşı çıkan birkaç makale okudum, ancak kalıcı bir liste tutmayı düşünmedim. Bir meslektaşım kısa bir süre önce benden bir liste istedi, bu yüzden buradaki herkese bu listeyi oluşturma konusunda yardım edeceğimi düşündüm. İşleri başlatmak için şu ana dek sahip olduğum şey: …

10
Taleb ve Kara Kuğu
Taleb'in kitabı "The Black Swan", birkaç yıl önce çıktığında New York Times'ın en çok satanıydı. Kitap şimdi ikinci baskısında. Bir JSM'de istatistikçilerle buluştuktan sonra (yıllık bir istatistik konferansı), Taleb istatistik istatistik eleştirisini bir miktar azalttı. Ancak kitabın itici gücü, istatistiklerin çok kullanışlı olmadığı, çünkü normal dağılıma ve çok nadir olaylara …

8
PCA bunu hala PCA'da döndürme (varimax gibi) izliyor mu?
Benim tecrübelerime R. SPSS dan (PCA kullanarak) biraz araştırma çoğaltmak çalıştık, principal() fonksiyon paketinden psychgole tek fonksiyonu oldu (ya Hafızam beni yanıltmıyorsa, ölü) çıktı maç. SPSS ile aynı sonuçları eşleştirmek için parametreyi kullanmak zorunda kaldım principal(..., rotate = "varimax"). Makalelerin PCA'yı nasıl yaptıkları hakkında konuştuğunu gördüm, ancak SPSS'nin çıktısına ve …



3
Bir sinir ağı ve derin bir inanç ağı arasındaki fark nedir?
İnsanların 'derin bir inanç' ağına atıfta bulundukları zaman bunun temelde bir sinir ağı olduğu ama çok büyük olduğu izlenimini ediniyorum. Bu doğru mu, yoksa derin bir inanç ağı da algoritmanın kendisinin farklı olduğu anlamına mı geliyor (yani, ileriye dönük sinir ağları değil, belki de geri besleme döngüleri olan bir şey)?

6
Neden k-araçlar kümeleme algoritması sadece Öklid uzaklık metriğini kullanıyor?
Verimlilik veya işlevsellik açısından k-aracı algoritmasının örneğin uzaklık ölçüsü olarak kosinüs (dis) benzerliğini kullanmadığı, ancak sadece Öklid normunu kullanabileceği belirli bir amaç var mı? Genel olarak, K-aracı yöntemi Öklid'den başka mesafeler göz önüne alındığında veya kullanıldığında uygun olacak ve doğru olacak mı? [@ Ttnphns ilavesi. Soru iki katlıdır. "(Olmayan) Öklid …

3
Aslında bir örnek ağaç randomForest :: getTree () 'den nasıl çizilir? [kapalı]
Herkes, aşağıdakilerden birkaç örnek ağacı çizmenin kütüphane veya kod önerilerini aldı: getTree(rfobj, k, labelVar=TRUE) (Evet, bunu operasyonel bir şekilde yapmanız gerekmediğini biliyorum, RF bir kara kutu, vb. Vb. Görüyorum. Bir ağacın görsel olarak akıl sağlığı kontrolünü yapmak istiyorum - herhangi bir değişkenin ters davranıp davranmadığını görmek için bir ağacı kontrol …

4
Belirsizlik önyükleme tahminlerine ilişkin varsayımlar
Belirsizlik tahminlerinin elde edilmesinde önyüklemenin kullanışlılığını takdir ediyorum, ancak beni her zaman rahatsız eden şey, bu tahminlere karşılık gelen dağılımın örnek tarafından tanımlanan dağıtım olmasıdır. Genel olarak, örnek frekanslarımızın tam olarak altta yatan dağılıma benziyor olduğuna inanmak kötü bir fikir gibi gözüküyor, bu nedenle örnek frekansların altta yatan dağılımı tanımladığı …


8
Bayesanlar: Olasılık fonksiyonunun köleleri?
"İstatistiklerin Tümü" adlı kitabında Prof. Larry Wasserman aşağıdaki örneği sunmaktadır (11.10, sayfa 188). Bir yoğunluk sahip olduğunu varsayalım öyle ki f ( x ) = cfff , g a,bilinen(negatif olmayan, integre) işlevi ve normalizasyon sabit c > 0 olduğubilinmemektedir.f(x)=cg(x)f(x)=cg(x)f(x)=c\,g(x)gggc>0c>0c>0 Hesaplayamadığımız durumlarda c = 1 / ∫ g ( x ) …

3
Lojistik bir regresyonda kalanlar ne anlama geliyor?
Cevaplarken bu soruyu John Christie lojistik regresyon modellerinin uyum artığı değerlendirerek değerlendirilmesi gerektiğini öne sürdü. OLS'deki artıkları nasıl yorumlayacağımı biliyorum, bunlar DV ile aynı ölçekte ve model tarafından öngörülen y ve y arasındaki farkları açıkça görüyorlar. Bununla birlikte, lojistik regresyon için, geçmişte tipik olarak AIC modelinin uygunluk tahminlerini inceledim, çünkü …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.