İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

7
T-testi veya parametrik olmayan test arasında nasıl seçim yapılır, örneğin küçük numunelerde Wilcoxon
Bazı hipotezler, Student t- testi (belki de iki örneklemde eşit olmayan varyanslar için Welch düzeltmesi kullanılarak) veya Wilcoxon eşleştirilmiş imzalı rütbe testi, Wilcoxon-Mann-Whitney U testi gibi parametrik olmayan bir test kullanılarak test edilebilir. veya eşleştirilmiş işaret testi. Nasıl bir yapabilirsiniz ilkeli testi örnek büyüklüğü "küçük" olduğunu, özellikle en uygun hangi …

4
Çekirdeğin ne olduğu sezgisel olarak nasıl açıklanır?
Birçok makine öğrenme sınıflandırıcısı (örneğin, destek vektör makineleri) bir tanenin bir çekirdek belirtmesine izin verir. Bir çekirdeğin ne olduğunu açıklamanın sezgisel bir yolu ne olurdu? Düşündüğüm bir yön, doğrusal ve doğrusal olmayan çekirdekler arasındaki ayrımdır. Basit bir ifadeyle, 'doğrusal karar fonksiyonları' ndan bir 'doğrusal olmayan karar fonksiyonlarından' bahsedebilirim. Ancak, bir …


6
Geri yayılım olmadan bir sinir ağı eğitmek mümkün mü?
Birçok sinir ağı kitabı ve öğreticisi, esas olarak degradeyi hesaplamak için bir araç olan backpropagation algoritmasına çok zaman harcıyor. Diyelim ki ~ 10K parametreleri / ağırlıkları olan bir model inşa ediyoruz. Bazı degrade serbest optimizasyon algoritmaları kullanarak optimizasyonu çalıştırmak mümkün müdür? Sayısal gradyanı hesaplamanın çok yavaş olacağını düşünüyorum, ama Nelder-Mead, …


2
“Vahşi doğada” p-hackleme hakkında ne biliyoruz?
İfade s (ayrıca: -hacking "veri tarama" , "balık" "gözetleme" ya da) yapay olarak istatistiksel olarak anlamlı hale sonuçlarında olduğu istatistiksel uygulama hataları çeşitli ifade eder. Aşağıdakiler dahil ancak bunlarla sınırlı olmamak üzere, “daha ​​önemli” bir sonuç elde etmenin birçok yolu vardır: sadece bir kalıbın bulunduğu verilerin "ilginç" bir alt kümesini …


13
Çok değişkenli verilerde aykırı değerleri belirlemenin en iyi yolu nedir?
En az üç değişkenli çok değişkenli büyük bir veri setim olduğunu varsayalım. Aykırı olanları nasıl bulabilirim? İkili saçılım grafikleri, 2 boyutlu alt alanların herhangi birinde bir ana hat olmayan bir boyutta bir 3 boyutlu varlığın mümkün olması nedeniyle çalışmaz. Bir regresyon problemini değil, gerçek çok değişkenli verileri düşünüyorum. Dolayısıyla, güçlü …


6
Temel veri kontrol testleri
Görevimde sık sık başkalarının veri kümeleriyle çalışıyorum, uzman olmayanlar bana klinik veriler getiriyor, özetlemelerine ve istatistiksel testler yapmalarına yardımcı oluyorum. Karşılaştığım sorun şu ki, getirdiğim veri kümelerinin neredeyse her zaman yazım hataları, tutarsızlıklar ve diğer her türlü sorunla karşılaşılması. Diğer kişilerin, gelen tüm veri kümelerini kontrol etmek için standart testler …

3
Karışıklık matrisini kullanarak çok sınıflı sınıflandırma için kesinlik ve hatırlamayı nasıl hesaplarsınız?
Çok sınıflı bir problem için kesinliği nasıl hesaplayabileceğimi ve bir karmaşa matrisi kullanarak nasıl hatırlayacağımı merak ediyorum. Spesifik olarak, bir gözlem ancak en olası sınıfa / etikete atanabilir. Hesaplamak istiyorum: Hassas = TP / (TP + FP) Hatırlama = TP / (TP + FN) Her sınıf için ve sonra mikro-ortalama …

10
Bir zaman serisi neden durağan olmak zorunda?
Durağan bir zaman serisinin, ortalamaları ve değişkenlikleri zaman içinde sabit olan bir seri olduğunu biliyorum. Birisi lütfen üzerinde farklı ARIMA veya ARM modelleri çalıştırmadan önce, veri setimizin sabit olduğundan emin olmak zorunda olduğumuzu açıklayabilir mi? Bu aynı zamanda otokorelasyon ve / veya zamanın bir faktör olmadığı normal regresyon modelleri için …

12
Bayesanlar Kimlerdir?
Biri istatistiklerle ilgilenmeye başladığında, "Frequentist" - "Bayesian" ve " yakında " (ve yine de Nate Silver'ın Sinyali ve Gürültüsünü okumamış olan kim ? Görüşmelerde ve giriş kurslarında, bakış açısı çok sıkça sıkıcıdır ( MLE , değerleri), ancak Bayes formülüne hayran kalmaya ve genellikle teğetsel olarak önceki bir dağıtım fikrine dokunmaya …


2
Yapay sinir ağına gömme katmanı nedir?
Birçok sinir ağı kütüphanesinde, Keras veya Lasagne'de olduğu gibi 'katmanları gömmek' vardır . Belgeleri okuduğumuza rağmen işlevini anladığımdan emin değilim. Örneğin, Keras belgelerinde şöyle yazıyor: Pozitif tamsayıları (indeksleri) sabit büyüklükteki vektörlere dönüştürün, örn. [[4], [20]] -> [[0.25, 0.1], [0.6, -0.2]] Bilgili bir kişi ne yaptığını ve ne zaman kullanacağınızı açıklayabilir …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.