İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

3
Güçlendirme öğreniminde indirim faktörünün rolünü anlama
Kendimi takviye öğrenmeyi öğretiyorum ve indirimli ödül kavramını anlamaya çalışıyorum. Bu nedenle, sisteme hangi devlet-eylem çiftlerinin iyi, hangilerinin kötü olduğunu söylemek için ödül gereklidir. Fakat anlamadığım, neden indirimli ödülün gerekli olduğudur. Niçin iyi bir duruma, daha sonra değil, kısa sürede ulaşılması önemli olsun? Bunun bazı özel durumlarda konuyla ilgili olduğunu …

3
Yinelenen Beklentiler Yasasının genelleştirilmesi
Geçenlerde bu kimliğe rastladım: E[E(Y|X,Z)|X]=E[Y|X]E[E(Y|X,Z)|X]=E[Y|X]E \left[ E \left(Y|X,Z \right) |X \right] =E \left[Y | X \right] Elbette bu kuralın basit versiyonunu biliyorum, yani ama bunun için gerekçe bulamadım genelleme.E[E(Y|X)]=E(Y)E[E(Y|X)]=E(Y)E \left[ E \left(Y|X \right) \right]=E \left(Y\right) Birisi beni bu konuda teknik olmayan bir referansı gösterebilirse veya daha da iyisi, bu önemli …

2
MA (q) zaman serisi modelleri neden “hareketli ortalamalar” olarak adlandırılıyor?
Bir zaman serisine göre "hareketli ortalama" okuduğumda, veya belki de ağırlıklı bir şey olduğunu düşünüyorum gibi ortalama . (Bunların aslında AR (3) modelleri olduğunu biliyorum, ancak bunlar beynimin atladığı şey.) Neden MA (q) modelleri hata terimleri veya "yenilikler" formülleri? Ne yok hareketli ortalama ilgisi var? Bazı açık sezgileri özlüyorum gibi …

3
Bootstrap'i Bayesian perspektifinden yorumlamak mümkün mü?
Tamam, bu beni geceleri ayakta tutan bir soru. Bootstrap prosedürü bazı Bayesian prosedürlerine yaklaşıyor olarak yorumlanabilir mi (Bayesian bootstrap hariç)? Gerçekten tutarlı ve anlaşılması kolay bulduğum istatistiklerin Bayesian "yorumunu" gerçekten seviyorum. Ancak, çok basit olan bootstrap prosedürü için de bir zayıflık var, ancak birçok durumda makul çıkarımlar var. Önyükleme işleminin …

4
Binom rastgele değişkenlerin bir örneğinin ortalaması için standart hata
2 sonucu olan bir deneme çalıştırdığımı ve 2 sonucun altında yatan "doğru" dağılımın ve : parametreleriyle binom bir dağılım olduğunu farz ediyorum .nnnpppBinomial(n,p)Binomial(n,p){\rm Binomial}(n, p) standart hatasını, varyansı biçiminden hesaplayabilirim : burada . Öyleyse,SEX=σXn√SEX=σXnSE_X = \frac{\sigma_X}{\sqrt{n}}Binomial(n,p)Binomial(n,p){\rm Binomial}(n, p)σ2X=npqσX2=npq \sigma^{2}_{X} = npqq=1−pq=1−pq = 1-pσX=npq−−−√σX=npq\sigma_X=\sqrt{npq} . Standart hata için alıyorum:SEX=pq−−√SEX=pqSE_X=\sqrt{pq} , fakat …

4
Dengesiz verilere karşı karar ağacı eğitimi
Veri madenciliğinde yeniyim ve dengesiz bir veri setine karşı bir karar ağacı yetiştirmeye çalışıyorum. Ancak, zayıf tahmin doğruluğu ile ilgili sorunlar yaşıyorum. Veriler ders okuyan öğrencilerden oluşur ve sınıf değişkeni iki değeri olan ders durumudur - Çekilmiş veya Akım. Yaş Etnik köken Cinsiyet Elbette ... Kurs Durumu Veri setinde, Akım …

3
Lojistik regresyon için düzenlileştirme yöntemleri
Ridge, Lasso, ElasticNet gibi yöntemler kullanılarak yapılan düzenlileştirme doğrusal regresyon için oldukça yaygındır. Aşağıdakileri bilmek istedim: Bu yöntemler lojistik regresyon için uygulanabilir mi? Öyleyse, lojistik regresyon için kullanılması gereken farklılıklar var mı? Bu yöntemler uygulanabilir değilse, lojistik regresyon nasıl düzenlenir?


2
Sinir ağında maxout nedir?
Bir sinir ağındaki maxout birimlerinin ne yaptığını açıklayan var mı? Nasıl performans gösterirler ve geleneksel birimlerden nasıl farklıdırlar? Goodfellow ve arkadaşlarının 2013 "Maxout Network" belgesini okumaya çalıştım . (Profesör Yoshua Bengio'nun grubundan), ama tam olarak anlamadım.

9
İstatistik öğretirken, “normal” veya “Gauss”?
Kitabımda çoğunlukla "Gauss dağılımı" kullandım, ancak birileri "normal dağılım" a geçmemi önerdi. Yeni başlayanlar için hangi terim kullanılacak? Elbette iki terim eşanlamlıdır , bu nedenle bu madde ile ilgili bir soru değil, yalnızca terimi daha yaygın olarak kullanılan bir meseledir. Ve elbette her iki terimi de kullanıyorum. Fakat hangisi daha …


3
Takılan çoklu regresyon modelini nasıl görselleştirebilirim?
Şu anda birkaç çoklu regresyon analizi içeren bir makale yazıyorum. Tek değişkenli doğrusal regresyonun görselleştirilmesi, dağılım grafikleri ile kolaydır, çoklu doğrusal regresyonları görselleştirmek için iyi bir yol olup olmadığını merak ediyordum. Şu anda sadece bağımlı değişkene karşı 1. bağımsız değişken, daha sonra 2. bağımsız değişken vb. Gibi dağılım grafikleri çiziyorum. …

5
Neden her bir bootstrap numunesi ortalama olarak kabaca üçte iki gözlem içeriyor?
Her önyükleme örneğinin (veya torbalı bir ağaç) gözlemlerin ortalama olarak yaklaşık / içereceği iddiasıyla çarpıştım .2/32/32/3 Ben şansı hiçbirinde seçildiği anlıyoruz dan çizer yerine geçer sahip örneklerin , yaklaşık ortaya eserler seçilen olmamanın şans.nnnnnn(1−1/n)n(1−1/n)n(1- 1/n)^n1/31/31/3 Bu formülün her zaman neden verdiğinin matematiksel açıklaması nedir ?≈1/3≈1/3\approx 1/3
42 bootstrap 

4
Taylor serisinin beklentisini almak (özellikle geri kalanlar)
Sorum, yaygın olarak kullanılan bir yöntemi, yani Taylor Serisinin beklenen değerini alarak doğrulamaya çalışmakla ilgilidir. Olumlu ortalama ve varyans olan rastgele bir değişkenimiz olduğunu varsayalım . Ek olarak, gibi bir fonksiyonumuz var .XXXμμ\muσ2σ2\sigma^2log(x)log⁡(x)\log(x) in Taylor Expansion'ını ortalamanın etrafında yaparsak, burada, her zamanki gibi, st.logXlog⁡X\log XlogX=logμ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξ3X,log⁡X=log⁡μ+X−μμ−12(X−μ)2μ2+13(X−μ)3ξX3, \log X = \log\mu + …

2
İkili sonuçlar için göreceli riski tahmin etmek için Poisson regresyonu
Kısa özet Poisson regresyonunun aksine (göreceli risklerle), ikili sonuçlara sahip kohort çalışmalarında lojistik regresyonun (oran oranlarıyla) kullanılması neden daha yaygın? Arka fon Lisans ve lisansüstü istatistik ve epidemiyoloji kursları, benim deneyimlerime göre, genellikle risk oranları tahmin oranları olarak rapor edilen ikili tahminlerle verileri modellemek için lojistik regresyonun kullanılması gerektiğini öğretiyor. …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.