İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

11
Çocuğa “Boyutluluk Laneti” ni açıklayın
Boyutluluk laneti hakkında defalarca duydum, ama nasıl olduysa hala fikrini kavrayamıyorum, hepsi sisli. Bunu bir çocuğa açıklayacağınız gibi bunu en sezgisel bir şekilde açıklayabilir miyim, böylece ben (ve benim gibi kafam karışan diğerleri) bunu iyi anlayabilsin mi? DÜZENLE: Şimdi, diyelim ki çocuk bir şekilde kümelemeyi duymuş (örneğin, oyuncaklarını nasıl kümelendiğini …

3
Model seçimi için iç içe çapraz doğrulama
Model seçimi için iç içe çapraz doğrulama nasıl kullanılır ? Çevrimiçi okuduklarımdan, iç içe geçmiş CV şu şekilde çalışır: Şebeke araştırması yapabildiğimiz iç CV döngüsü vardır (örneğin, mevcut her model için K-katını çalıştırma, örneğin hiperparametrelerin / özelliklerin kombinasyonu) İç katmanda kazanılan modelin performansını ayrı bir dış kat üzerinde ölçtüğümüz dış …


3
Eklem dağılımının Gauss olmayan olmadığı bir çift Gauss rastgele değişkeni olması mümkün mü?
Biri bana bu soruyu bir iş görüşmesinde sordu ve ortak dağıtımlarının her zaman Gauss olduğunu söyledi. Ben her zaman bir iki değişkenli Gaussian'ı araçları, varyansları ve kovaryanslarıyla yazabileceğimi düşündüm. İki Gaussian'ın ortak ihtimalinin Gauss olmadığı bir durum olup olmadığını merak ediyorum.

5
ANOVA neden doğrusal regresyona kıyasla farklı bir araştırma metodolojisiymiş gibi öğretiliyor / kullanılıyor?
ANOVA uygun kukla değişkenlerin kullanımı ile lineer regresyona eşdeğerdir. ANOVA veya lineer regresyon kullanmanıza bakılmaksızın sonuçlar aynı kalır. Eşdeğerlikleri ışığında, doğrusal regresyon yerine ANOVA'nın kullanılmasının herhangi bir nedeni var mı? Not: Özellikle doğrusal regresyon yerine ANOVA kullanımının teknik sebeplerini duymakla ilgileniyorum . Düzenle İşte tek yönlü ANOVA kullanan bir örnek. …
91 regression  anova 

11
Doğrusal regresyon ne zaman “makine öğrenmesi” olarak adlandırılmalıdır?
Yakın tarihli bir collokonyumda konuşmacının özeti, makine öğrenmeyi kullandıklarını iddia etti. Konuşma sırasında, makine öğrenmeyle ilgili tek şey, verileri üzerinde doğrusal regresyon gerçekleştirmeleriydi. 5D parametre alanındaki en uygun katsayıları hesapladıktan sonra, bir sistemdeki bu katsayıları diğer sistemlerin en uygun katsayılarıyla karşılaştırdılar. Doğrusal regresyon makinesi ne zaman öğrenme , sadece en …


4
PCA ve varyans oranı açıklandı
Genel olarak, PCA gibi bir analizdeki varyansın oranının ilk ana bileşen tarafından açıklandığını söylemek ne anlama gelir ? Birisi bunu sezgisel olarak açıklayabilir ancak aynı zamanda “açıklamanın” temel bileşen analizi (PCA) açısından ne anlama geldiğinin kesin bir matematiksel tanımını verebilir mi?xxx Basit doğrusal regresyon için, en uygun çizginin r karesi …


7
İstatistiksel bir analiz projesi nasıl verimli bir şekilde yönetilir?
Bilgisayar biliminde proje yönetimi ve tasarım kalıplarını sık sık duyuyoruz, ancak istatistiksel analizde daha az sıklıkta duyuyoruz. Bununla birlikte, etkili ve dayanıklı bir istatistiksel proje tasarlamaya doğru belirleyici bir adımın işleri düzenli tutmak olduğu görülmektedir. Genellikle R ve tutarlı bir dosya düzenini ayrı klasörlerde (ham veri dosyası, dönüştürülmüş veri dosyası, …

1
Yorumlama plot.lm ()
R'de arsa (lm) tarafından oluşturulan grafikleri yorumlamakla ilgili bir sorum vardı. Ölçek konumunu ve kaldıraç arsalarını nasıl yorumlayacağımı söyleyebilir misiniz? Herhangi bir yorum takdir edilecektir. Temel istatistik, regresyon ve ekonometri bilgisini alır.

4
Derin öğrenmede mevcut görüntü yerine veri kümesinin görüntü ortalamasını çıkartarak görüntüleri neden normalleştirelim?
Görüntülerin nasıl normalleştirileceğine dair bazı farklılıklar var ancak çoğu bu iki yöntemi kullanıyor gibi görünüyor: Tüm görüntüler üzerinde hesaplanan kanal başına ortalamayı çıkarın (örn. VGG_ILSVRC_16_layers ) Tüm resimler üzerinde hesaplanan piksel / kanala göre çıkarma (örneğin, CNN_S , ayrıca Caffe'nin referans ağına bakınız ) Doğal yaklaşım aklımda her görüntüyü normalleştirmek …

1
Çapraz vs iç içe rasgele efektler: bunlar nasıl farklılık gösterir ve lme4'te doğru olarak nasıl belirtilir?
İşte nasıl iç içe geçmiş çapraz rastgele etkilerini anladım: İç içe rasgele efektler , bir alt seviye faktörü yalnızca bir üst seviye faktörünün belirli bir düzeyinde göründüğünde ortaya çıkar. Örneğin, sınıftaki öğrenciler belirli bir zamanda sabit bir noktada. Gelen lme4Yani, iki eşdeğer yöntemden biriyle iç içe veriler için rasgele etkiler …

4
Sayım regresyonu için tanı grafikleri
Hangi sayım değişkenleri (ve belki de resmi testler) sonucun bir sayı değişkeni olduğu gerilemeler için en bilgilendirici buluyor musunuz? Özellikle Poisson ve negatif binom modellerinin yanı sıra her birinin sıfır şişirilmiş ve engelli benzerleri ile ilgileniyorum. Bulduğum kaynakların çoğu, bu parsellerin "nasıl olması gerektiği" hakkında tartışmadan, artıkları ve takılan değerleri …

4
Gama GLM'lerini ne zaman kullanmalı?
Gama dağılımı oldukça geniş bir şekil aralığında olabilir ve ortalama ile varyans arasındaki iki parametre ile arasındaki bağlantıya bakıldığında, negatif olmayan verilerde heteroskedasticity ile başa çıkmak için, log-dönüştürülmüş OLS'nin yapabileceği şekilde WLS veya bir tür heteroskedasticity-tutarlı VCV tahmincisi olmadan yapmayın. Olumsuz, rutin olmayan veri modellemesi için daha fazla kullanırdım, ama …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.