İstatistikler ve Büyük Veri

7

T-testi veya parametrik olmayan test arasında nasıl seçim yapılır, örneğin küçük numunelerde Wilcoxon

Bazı hipotezler, Student t- testi (belki de iki örneklemde eşit olmayan varyanslar için Welch düzeltmesi kullanılarak) veya Wilcoxon eşleştirilmiş imzalı rütbe testi, Wilcoxon-Mann-Whitney U testi gibi parametrik olmayan bir test kullanılarak test edilebilir. veya eşleştirilmiş işaret testi. Nasıl bir yapabilirsiniz ilkeli testi örnek büyüklüğü "küçük" olduğunu, özellikle en uygun hangi …

96 hypothesis-testing t-test nonparametric small-sample wilcoxon-mann-whitney

4

Çekirdeğin ne olduğu sezgisel olarak nasıl açıklanır?

Birçok makine öğrenme sınıflandırıcısı (örneğin, destek vektör makineleri) bir tanenin bir çekirdek belirtmesine izin verir. Bir çekirdeğin ne olduğunu açıklamanın sezgisel bir yolu ne olurdu? Düşündüğüm bir yön, doğrusal ve doğrusal olmayan çekirdekler arasındaki ayrımdır. Basit bir ifadeyle, 'doğrusal karar fonksiyonları' ndan bir 'doğrusal olmayan karar fonksiyonlarından' bahsedebilirim. Ancak, bir …

96 machine-learning svm references kernel-trick intuition

4

SVM için çekirdek nasıl seçilir?

SVM kullanırken, bir çekirdek seçmemiz gerekir. Nasıl bir çekirdek seçileceğini merak ediyorum. Çekirdek seçiminde herhangi bir kriter var mı?

95 machine-learning svm kernel-trick

6

Geri yayılım olmadan bir sinir ağı eğitmek mümkün mü?

Birçok sinir ağı kitabı ve öğreticisi, esas olarak degradeyi hesaplamak için bir araç olan backpropagation algoritmasına çok zaman harcıyor. Diyelim ki ~ 10K parametreleri / ağırlıkları olan bir model inşa ediyoruz. Bazı degrade serbest optimizasyon algoritmaları kullanarak optimizasyonu çalıştırmak mümkün müdür? Sayısal gradyanı hesaplamanın çok yavaş olacağını düşünüyorum, ama Nelder-Mead, …

94 machine-learning neural-networks optimization backpropagation

3

Sinirsel net ağırlık azalması ve öğrenme oranı arasındaki fark

Yapay sinir ağları bağlamında, öğrenme hızı ve kilo kaybı arasındaki fark nedir?

94 neural-networks terminology

2

“Vahşi doğada” p-hackleme hakkında ne biliyoruz?

İfade s (ayrıca: -hacking "veri tarama" , "balık" "gözetleme" ya da) yapay olarak istatistiksel olarak anlamlı hale sonuçlarında olduğu istatistiksel uygulama hataları çeşitli ifade eder. Aşağıdakiler dahil ancak bunlarla sınırlı olmamak üzere, “daha önemli” bir sonuç elde etmenin birçok yolu vardır: sadece bir kalıbın bulunduğu verilerin "ilginç" bir alt kümesini …

94 hypothesis-testing statistical-significance p-value model-selection reproducible-research

30

İstatistikçi olmayan bilim adamları için hangi kitabı önerirsiniz?

İstatistikçi olmayan bilim insanlarına hangi kitabı önerirsiniz? Net teslimat en takdir edilir. Tipik görevler için uygun teknik ve yöntemlerin açıklanmasının yanı sıra: zaman serisi analizi, büyük veri setlerinin sunumu ve toplanması.

94 references

13

Çok değişkenli verilerde aykırı değerleri belirlemenin en iyi yolu nedir?

En az üç değişkenli çok değişkenli büyük bir veri setim olduğunu varsayalım. Aykırı olanları nasıl bulabilirim? İkili saçılım grafikleri, 2 boyutlu alt alanların herhangi birinde bir ana hat olmayan bir boyutta bir 3 boyutlu varlığın mümkün olması nedeniyle çalışmaz. Bir regresyon problemini değil, gerçek çok değişkenli verileri düşünüyorum. Dolayısıyla, güçlü …

94 multivariate-analysis outliers

5

Artıları / eksileri olan sinir ağlarında kapsamlı aktivasyon fonksiyonları listesi

Nöral ağlarda, artıları / eksileriyle birlikte (ve ideal olarak bazılarının başarılı oldukları veya başarılı olamadıkları yayınlara işaretçiler) kapsamlı bir etkinleştirme işlevleri listesi veren herhangi bir referans belgesi var mı?

94 neural-networks references

6

Temel veri kontrol testleri

Görevimde sık sık başkalarının veri kümeleriyle çalışıyorum, uzman olmayanlar bana klinik veriler getiriyor, özetlemelerine ve istatistiksel testler yapmalarına yardımcı oluyorum. Karşılaştığım sorun şu ki, getirdiğim veri kümelerinin neredeyse her zaman yazım hataları, tutarsızlıklar ve diğer her türlü sorunla karşılaşılması. Diğer kişilerin, gelen tüm veri kümelerini kontrol etmek için standart testler …

93 dataset outliers checking

3

Karışıklık matrisini kullanarak çok sınıflı sınıflandırma için kesinlik ve hatırlamayı nasıl hesaplarsınız?

Çok sınıflı bir problem için kesinliği nasıl hesaplayabileceğimi ve bir karmaşa matrisi kullanarak nasıl hatırlayacağımı merak ediyorum. Spesifik olarak, bir gözlem ancak en olası sınıfa / etikete atanabilir. Hesaplamak istiyorum: Hassas = TP / (TP + FP) Hatırlama = TP / (TP + FN) Her sınıf için ve sonra mikro-ortalama …

92 machine-learning classification precision-recall multi-class

10

Bir zaman serisi neden durağan olmak zorunda?

Durağan bir zaman serisinin, ortalamaları ve değişkenlikleri zaman içinde sabit olan bir seri olduğunu biliyorum. Birisi lütfen üzerinde farklı ARIMA veya ARM modelleri çalıştırmadan önce, veri setimizin sabit olduğundan emin olmak zorunda olduğumuzu açıklayabilir mi? Bu aynı zamanda otokorelasyon ve / veya zamanın bir faktör olmadığı normal regresyon modelleri için …

92 regression time-series stationarity

12

Bayesanlar Kimlerdir?

Biri istatistiklerle ilgilenmeye başladığında, "Frequentist" - "Bayesian" ve " yakında " (ve yine de Nate Silver'ın Sinyali ve Gürültüsünü okumamış olan kim ? Görüşmelerde ve giriş kurslarında, bakış açısı çok sıkça sıkıcıdır ( MLE , değerleri), ancak Bayes formülüne hayran kalmaya ve genellikle teğetsel olarak önceki bir dağıtım fikrine dokunmaya …

92 bayesian mathematical-statistics inference bayes frequentist

2

Sade dilde kovaryans nedir?

Sade dilde kovaryans nedir ve tekrarlanan önlem tasarımlarına göre bağımlılık , korelasyon ve varyans-kovaryans yapısı terimleriyle nasıl bağlantılıdır ?

92 correlation repeated-measures terminology covariance independence

2

Yapay sinir ağına gömme katmanı nedir?

Birçok sinir ağı kütüphanesinde, Keras veya Lasagne'de olduğu gibi 'katmanları gömmek' vardır . Belgeleri okuduğumuza rağmen işlevini anladığımdan emin değilim. Örneğin, Keras belgelerinde şöyle yazıyor: Pozitif tamsayıları (indeksleri) sabit büyüklükteki vektörlere dönüştürün, örn. [[4], [20]] -> [[0.25, 0.1], [0.6, -0.2]] Bilgili bir kişi ne yaptığını ve ne zaman kullanacağınızı açıklayabilir …

92 machine-learning neural-networks python word-embeddings