İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

17
Makine öğrenme yemek kitabı / referans kartı / hile sayfası?
Olasılık ve İstatistik Yemek Kitabı ve Veri Madenciliği İçin R Referans Kartı gibi kaynakları inanılmaz derecede faydalı buluyorum . Belli ki referans olarak iyi hizmet ediyorlar ama aynı zamanda bir konu hakkındaki düşüncelerimi düzenlememe ve toprağın düzenini almama yardımcı oluyorlar. S: Bu kaynaklara benzer bir şey makine öğrenme yöntemleri için …

8
Kategorik verileri sürekli olarak ele almak hiç mantıklı geliyor mu?
Kesin ve sürekli veri üzerine bu soruyu cevaplarken, kategorik verileri sürekli olarak ele almanın nadiren mantıklı olduğunu ileri sürdüm. Anlaşılır görünen, ancak sezgi genellikle istatistik için kötü bir rehber, ya da en azından benim. Şimdi merak ediyorum: doğru mu? Yoksa kategorik verilerden bir sürekliliğe dönüşümün gerçekten yararlı olduğu analizler var …

2
Bayes regresyonu: Standart regresyon ile karşılaştırıldığında nasıl yapılır?
Bayesian regresyonu hakkında bazı sorularım var: gibi standart bir regresyon . Bunu bir Bayesian regresyonuna dönüştürmek , ve için önceden dağıtımlara ihtiyacım var (yoksa bu şekilde çalışmıyor)?y=β0+β1x+εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 Standart regresyonda biri artıkları en aza indirmeye ve için tekli değerler elde . Bayes regresyonunda bu …


3
Log ölçekleri ne zaman uygun olur?
Zaman çizelgesi grafiğindeki y ekseni gibi, belirli durumlarda çizelgeleme / grafik oluşturma uygun olduğunda günlük ölçeklerini kullanmanın okudum. Ancak, bunun neden böyle olduğu veya ne zaman uygun olacağı konusunda kesin bir açıklama bulamadım. Lütfen aklınızda bulundurun, istatistikçi değilim, bu yüzden noktayı tamamen kaybediyor olabilirim ve eğer durum buysa, iyileştirici kaynakların …

3
Örnek standart sapma neden
Vikipedi sapma tahmini standart sapma hakkındaki makaleye göre örnek SD s = 1n - 1Σi = 1n( xben- x¯¯¯)2---------------√s=1n-1Σben=1n(xben-x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} nüfusun SD'sinin önyargılı bir tahmincisidir. Bu E ( √ olduğunu belirtir. .E( s2--√) ≠ D( s2)-----√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} NB. Rastgele değişkenler bağımsızdır ve her biri …

9
“80 kazadan 1'i bir araba kazası nedeniyle meydana gelir” olarak, “80 kişiden 1'i bir araba kazası sonucu öldü” şeklinde ifade etmek yanlış mıdır?
Beyan Bir (S1): "80 ölümde bir araba kazasından kaynaklanıyor." İkinci İfade (S2): "80 kişiden biri trafik kazası sonucu öldü." Şimdi, şahsen bu iki ifade arasında hiç bir fark görmüyorum. Yazarken, onları sıra dışı izleyicilerle birbirleriyle değiştirilebileceğini düşünürdüm. Ancak şimdi bu konuda iki kişi tarafından zorlandım ve ek bir bakış açısı …

7
Endüstri ve Kaggle zorlukları. Daha fazla gözlem toplamak ve fantezi modellemeden daha fazla değişkene erişebilmek daha mı önemli?
Umarım bu başlık kendi kendini açıklar niteliktedir. Kaggle'da kazananların çoğu, MSE'nin% birkaçını sıkıştırmak için bazen yüzlerce baz modeliyle istiflemeyi kullanıyor, genel olarak, deneyimlerinizde, istifleme gibi fantezi modellemenin ne kadar önemli olduğu, sadece daha fazla veri toplama ve daha fazla özellik toplama veri için?


1
R'deki lojistik regresyon, mükemmel ayrılma ile sonuçlandı (Hauck-Donner fenomeni). Şimdi ne olacak?
50 sürekli açıklayıcı değişken kullanarak ikili sonucu tahmin etmeye çalışıyorum (değişkenlerin çoğunun aralığı ila ∞ arasındadır ). Veri setimin neredeyse 24.000 satırı var. R'de koşarken , alıyorum:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically 0 or 1 occurred Mükemmel ayrılmanın olabileceğini gösteren diğer yanıtları …


8
Derin öğrenme için R kütüphaneleri
Derin sinir ağları için iyi bir R kütüphanesi olup olmadığını merak ediyor muydum? Orada olduğunu biliyorum nnet, neuralnetve RSNNS, ancak bunların hiçbiri derin öğrenme yöntemlerini uygulamak gibi görünüyor. Özellikle denetlenmeyen öğrenmeden sonra denetlenen öğrenmeden ve eş-uyum sağlamak için bırakma kullanmaktan özellikle ilgileniyorum . / edit: Birkaç yıl sonra, h20 derin …

4
% 95 güven aralığında tüm değerler eşit derecede muhtemel mi?
Şu soruya uyumsuz bilgi buldum: " Biri, araçlardaki veya oranlardaki farkın% 95'lik bir güven aralığı (CI) oluşturursa, CI içindeki tüm değerler eşit derecede muhtemel mi? Veya, en muhtemel tahmin noktası mı? CI'nin "kuyrukları" na yakın olan değerlerin CI ortasındaki değerlerden daha düşük olması durumunda? Örneğin, randomize bir klinik çalışma raporunda, …

6
Fisher ve Neyman-Pearson yaklaşımları arasındaki “melez”, istatistiksel testlere gerçekten yaklaşıyor mu?
İstatistiksel testlere en yaygın yaklaşımın iki yaklaşım arasında bir "melez" olduğuna göre belirli bir düşünce okulu vardır: Fisher ve Neyman-Pearson; Bu iki yaklaşım, iddiaya göre, "uyumsuz" ve sonuçta ortaya çıkan "melez" bir "tutarsız kargaşa" dır. Bir kaynakça ve aşağıda bazı alıntılar sunacağım, fakat şimdilik İstatistiksel hipotez testi ile ilgili wikipedia …

9
Bir lme4 karma modelinde etkinin p-değeri (önemini kontrol et) nasıl elde edilir?
Karışık modele uyması için lme4 in R kullanıyorum lmer(value~status+(1|experiment))) değerin sürekli olduğu yerde, durum ve deney faktördür ve ben anlıyorum Linear mixed model fit by REML Formula: value ~ status + (1 | experiment) AIC BIC logLik deviance REMLdev 29.1 46.98 -9.548 5.911 19.1 Random effects: Groups Name Variance Std.Dev. …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.