İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

1
Mantel'nin testi neden Moran I'de tercih edilir?
Mantel testi , biyolojik çalışmalarda , hayvanların mekansal dağılımı (uzayda konum) arasındaki ilişkiyi, örneğin genetik bağıntıları, saldırganlık oranları veya başka bir nitelik ile incelemek için yaygın olarak kullanılmaktadır . Bol miktarda iyi dergi kullanıyor ( PNAS, Hayvan Davranışı, Moleküler Ekoloji ... ). Doğada oluşabilecek bazı desenler ürettim, ama Mantel'in testi …


3
Tufte tarzı görselleştirmeleri destekleyen deneysel kanıtlar?
S: Nigel Holmes'un grafiksel önemsiz görselleştirmeleri üzerindeki Tufte tarzı, minimalist, veri-konuşmalı görselleştirmelerini destekleyen deneysel kanıtlar var mı ? Buradaki R parsellerine nasıl grafik önemsiz ekleyeceğimi sordum ve yanıt verenler bana çok ağır bir miktar attılar. Bu nedenle, elbette, şahsi olmadığım, anti-grafik önemsiz konumlarını destekleyen --- sadece "Tufte öyle dedi" den …

4
Alışılmış bir programlama dili kullanılarak bilinen ortalama ve varyans ile normal bir dağılımdan nasıl örnek alınır?
Daha önce istatistiklerle ilgili bir ders almadım, umarım burada doğru yerde soruyorum. Normal bir dağılımı tanımlayan sadece iki verim olduğunu varsayalım: ortalama ve variance . Bu dağıtıma rastgele örnekleme yapmak için bir bilgisayar kullanmak istiyorum, öyle ki bu iki istatistiğe saygı duyuyorum.σ 2μμ\muσ2σ2\sigma^2 Ortalamayı 0 civarında normalleştirerek halledebileceğim çok açık: …

6
İki dizi dizgenin (R cinsinden) eşleştirilmesi nasıl yapılır?
Bunun nasıl adlandırılması gerektiğinden emin değilim, bu yüzden daha iyi bir terim biliyorsanız lütfen beni düzeltin. İki listem var. 55 öğeden biri (örneğin: bir dizge vektörü), diğer 92 dizisi. Öğe adları benzer ancak aynı değil. Ben en iyi aday bulmak istediğiniz s 55 listedeki öğeleri (Ben o zaman geçmesi ve …
36 r  text-mining 


4
Bir araçsal değişken nedir?
Enstrümantal değişkenler uygulamalı ekonomi ve istatistikte giderek yaygınlaşmaktadır. Başlatılmamış olarak, aşağıdaki sorulara teknik olmayan cevaplar verebilir miyiz: Bir araçsal değişken nedir? Ne zaman bir araçsal değişken kullanmak istersiniz? Kişi bir araçsal değişkeni nasıl bulur veya seçer?


3
Makine Öğrenimi: İkili tahminler için kategorik bir çapraz entropi veya ikili çapraz entropi kaybı kullanmalı mıyım?
Öncelikle, ikili tahminler yapmam gerekirse, tek bir sıcak kodlama gerçekleştirerek en az iki sınıf oluşturmam gerektiğini fark ettim. Bu doğru mu? Ancak, ikili çapraz entropi sadece bir sınıf içeren tahminler için mi? Genelde çoğu kütüphanede (TensorFlow gibi) bulunan kategorik bir çapraz entropi kaybı kullansaydım, önemli bir fark olur mu? Aslında, …

5
Sinir ağının maliyet fonksiyonu dışbükey mi?
Maliyet fonksiyonu sinir ağı ait ve olduğu iddia edilen dışbükey . Neden böyle olduğunu anlamıyorum, çünkü lojistik regresyonun maliyet fonksiyonuna oldukça benzer olduğunu görüyorum, değil mi?J( W, B )J(W,b)J(W,b) Dışbükey değilse, 2. derece türevi , değil mi?∂J∂W&lt; 0∂J∂W&lt;0\frac{\partial J}{\partial W} < 0 GÜNCELLEŞTİRME Aşağıda verilen cevaplar ve @ gung'un yorumuna …



1
MCMC'ye karşı varyasyonel çıkarım: ne zaman diğerini seçmelisin?
Ben, Metropolis Hastings vb Gibbs örneklemesi gibi MCMC çeşitli tatlar içeren VI ve MCMC hem genel fikir edinmek düşünüyorum Bu kağıt iki yöntemde harika serimlemesini sunuyor. Aşağıdaki sorularım var: Bayesian çıkarım yapmak istersem, neden diğerini seçeyim? Her yöntemin artıları ve eksileri nelerdir? Bunun oldukça geniş bir soru olduğunu anlıyorum, ancak …


2
Eğer sadece tahminler ilgiliyse, neden sırt üstü kement kullanılmalı?
İstatistiksel Öğrenmeye Giriş bölümündeki 223. Sayfada yazarlar ridge regresyonu ile kement arasındaki farkları özetlemektedir. "Kementin önyargı, varyans ve MSE açısından sırt regresyonundan daha iyi performans gösterme eğiliminde olduğu" bir örnek (Şekil 6.9). Kementin neden arzu edildiğini anlıyorum: çok sayıda katsayıyı 0'a daralttığı için basit ve yorumlanabilen modeller ile sonuçlanan seyrek …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.