İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

6
Lojistik regresyon ve algılayıcı arasındaki fark nedir?
Andrew Ng'un Makine Öğrenimi ile ilgili ders notlarına bakıyorum . Notlar bize lojistik gerilemeyi ve ardından algılayıcısını tanıtıyor. Perceptron tarif edilirken, notlar sadece lojistik regresyon için kullanılan eşik fonksiyonunun tanımını değiştirdiğimizi söylüyor. Bunu yaptıktan sonra, sınıflandırma için Perceptron modelini kullanabiliriz. Öyleyse sorum şu - eğer bunun belirtilmesi gerekiyorsa ve Perceptron'u …



3
Neden bir önyükleme dağılımının ortalamasını bildirmiyorsunuz?
Biri standart hatayı elde etmek için bir parametreyi patlattığında, parametrenin bir dağılımını elde ederiz. Neden bu dağılımın ortalamasını bir sonuç olarak kullanmıyoruz veya almaya çalıştığımız parametre için tahmin yapmıyoruz? Dağılım, gerçekte yaklaşık değil mi? Bu nedenle “gerçek” değer hakkında iyi bir tahminde bulunacağız. Yine de örneklemimizden aldığımız orijinal parametreyi rapor …

5
Bireysel bir araştırmacı sahte keşif oranını nasıl düşünmelidir?
Yanlış Keşif Hızı'nın (FDR) bireysel araştırmacıların sonuçlarını nasıl bilgilendirmesi gerektiği konusunda kafamı sarmaya çalışıyorum. Örneğin, çalışmanızın gücü yetersizse, sonuçlarınızı düzeyinde anlamlı olsalar bile misiniz? Not: Birden fazla test düzeltmesi için bir yöntem olarak değil , birden fazla çalışmanın sonuçlarını toplu olarak incelemek bağlamında FDR'den bahsediyorum .α=.05α=.05\alpha = .05 Test edilen …

3
LASSO için gösterge / binary / kukla tahmin edicilerin ölülüp kurtarılmayacağı
LASSO (ve diğer model seçim prosedürleri) için tahmincileri yeniden düzenlemek çok önemlidir. Genel öneri ı takip sürekli değişkenler için bir 0 ortalama, 1 standart sapma normalleşmesini kullanmak için basitçe. Ama aptallarla ne ilgisi var? Örneğin , aynı (mükemmel) yaz okulundan bazı uygulamalı örnekler , muhtemelen aptallarla karşılaştırılabilir olması için sürekli …

3
Hangi değişken enflasyon faktörü kullanmalıyım: veya ?
vifR paketindeki işlevi kullanarak varyans enflasyon faktörlerini yorumlamaya çalışıyorum car. İşlev hem genelleştirilmiş bir hem de . Göre yardım dosyası , ikinci değerdirVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Güven elipsoidinin boyutunu ayarlamak için, işlev ayrıca GVIF ^ [1 / (2 * df)] değerini de basar, burada df terimi ile ilişkili serbestlik dereceleridir. Bu açıklamanın anlamını …

3
Örneklem büyüklüğü değişken sayısından az olduğunda örnek kovaryans matrisi neden tekildir?
Diyelim ben var ki boyutlu değişkenli Gauss dağılımı. Ve alır , n gözlemler (bunların her a s -vector) bu dağılımdan ve örnek kovaryans matrisi hesaplamak S . Bu yazıda yazarlar, p > n ile hesaplanan örnek kovaryans matrisinin tekil olduğunu belirtmektedir .pppnnnpppSSSp>np>np > n Nasıl doğru veya türetilmiş? Herhangi bir …



5
GBM'de etkileşim derinliği ne demektir?
R'de gbm'deki etkileşim derinliği parametresi ile ilgili bir sorum vardı. Bu, özür dilediğim noob bir soru olabilir, ancak bir ağaçtaki terminal düğümlerinin sayısını belirttiğine inandığım parametre, temel olarak X-yolunu gösterir. öngörücüler arasındaki etkileşim? Sadece bunun nasıl çalıştığını anlamaya çalışıyorum. Ek olarak, bu iki faktör değişkeninin tek bir faktörde birleştirilmesi haricinde, …

5
SVD'yi ortak filtrelemede nasıl kullanırım?
SVD'nin işbirlikçi filtrelemede nasıl kullanıldığına biraz karıştı. Sosyal bir grafiğim olduğunu ve kenarlardan bitişik bir matris oluşturduğumu ve ardından bir SVD (benim düzenlileştirme, öğrenme oranları, sparite optimizasyonları vb. Unutalım) unutacağımı varsayalım, önerilerimi geliştirmek için bu SVD'yi nasıl kullanırım? Sosyal grafiğimin instagrama karşılık geldiğini ve yalnızca sosyal grafiğe dayanarak hizmette kullanıcı …

4
McNemar'ın testi ile ki-kare testi arasındaki fark nedir ve bunların ne zaman kullanılacağını nasıl bildiniz?
Farklı kaynaklar üzerinde okumaya çalıştım, ancak benim durumumda hangi testin uygun olacağı konusunda hala net değilim. Veri setim hakkında sorduğum üç farklı soru var: Denekler, X'ten kaynaklanan enfeksiyonlar için farklı zamanlarda test edilir. X sonrası için pozitif oranlarının X öncesi için pozitif oranı ile ilişkili olup olmadığını bilmek istiyorum: After …

5
Çoklu doğrusal regresyon için en küçük kareler nasıl hesaplanır?
Basit doğrusal regresyon durumunda y=β0+β1xy=β0+β1xy=\beta_0+\beta_1x , en küçük kareler tahmincisini türetebilirsiniz , değerini tahmin için bilmek zorundaβ 0 β 1β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2β^1=∑(xi−x¯)(yi−y¯)∑(xi−x¯)2\hat\beta_1=\frac{\sum(x_i-\bar x)(y_i-\bar y)}{\sum(x_i-\bar x)^2}β^0β^0\hat\beta_0β^1β^1\hat\beta_1 olduğunu varsayalım , tahmin etmeden nasıl ? veya bu mümkün değil mi?β 1 β 2y=β1x1+β2x2y=β1x1+β2x2y=\beta_1x_1+\beta_2x_2β^1β^1\hat\beta_1β^2β^2\hat\beta_2

2
Doğrusal olmayanları doyurma terimi ne anlama geliyor?
Deep Convolutional Yapay Sinir Ağları ile ImageNet Sınıflandırması makalesini okuyordum ve 3. bölümde, Convolutional Sinir Ağlarının yapısını nasıl kullandıklarını açıkladıklarını açıklıyorlardı: doygun olmayan doğrusal olmayanf( x ) = m a x ( 0 , x ) .f(x)=mbirx(0,x).f(x) = max(0, x). çünkü eğitmek daha hızlıydı. Bu yazıda, CNN'lerde, sigmoidde ve hiperbolik …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.