İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap


7
Bire bir çıkışta yanlılık ve varyans vs K-kat çapraz doğrulama
Farklı çapraz doğrulama yöntemleri, model varyansı ve önyargı açısından nasıl karşılaştırılır? Sorumu kısmen bu konuya göre motive ediyor: katlı çapraz onaylamada en uygun kıvrım sayısı : bir kez dışarıda bırakılan CV her zaman en iyi seçenek midir? KKK. Buradaki cevap, bir kez dışarı bırakılan çapraz doğrulama ile öğrenilen modellerin normal …


14
Neden sağlam (ve dirençli) istatistikler klasik tekniklerin yerine geçmedi?
Verileri kullanarak iş sorunlarını çözerken, klasik istatistiklerin altını çizdiği en az bir anahtar varsayımın yaygın olduğu yaygındır. Çoğu zaman, hiç kimse bu varsayımları kontrol etmekte hiçbir sıkıntı çekmez. Örneğin, ortak web metriklerinin çoğunun "uzun kuyruklu" olduğu (normal dağılıma göre) şimdiye dek çok iyi belgelendirildiği anlaşılmaktadır. Diğer bir örnek olarak, çevrimiçi …

8
En iyi uyum çizgisi iyi bir uyum gibi görünmüyor. Neden?
Bu Excel grafiğine bir göz atın: 'En iyi uyum' çizgisi 'sağduyuluların tam ortasından geçen dikey bir çizgi gibi görünebilir (elle kırmızı renkle düzenlenmiştir). Bununla birlikte, Excel tarafından karar verilen doğrusal eğilim çizgisi gösterilen çapraz siyah çizgidir. Excel neden (insan gözüyle) yanlış görünen bir şey üretti? Biraz daha sezgisel görünen en …


5
“Kapalı form çözümü” ne anlama geliyor?
Sık sık "kapalı form çözümü" terimi ile karşılaştım. Kapalı formda bir çözüm ne demektir? Belirli bir problem için yakın formlu bir çözüm bulunup bulunmadığı nasıl belirlenir? Çevrimiçi arama yaparken, bazı bilgiler buldum, ancak istatistiksel ya da olasılıksal bir model / çözüm geliştirme bağlamında hiçbir şey bulamadım. Regresyonu çok iyi anlıyorum, …




3
Lojistik regresyon yaparken dengesiz bir örnek önemlidir?
Tamam, bu yüzden 20: 1 kuralını göz önünde bulundurarak yeterince iyi bir örneğe sahip olduğumu düşünüyorum: toplam 7 aday belirleyici değişkeni için oldukça büyük bir örnek (N = 374). Benim sorunum şudur: Ne kullanırsam tahmin değişkenleri kümesi ne olursa olsun, sınıflandırmalar% 100 özgüllük ve% 0 duyarlılıktan daha iyi olamaz. Bununla …

10
Sezgisel "varyans" anlama
Birine değişkenlik kavramını açıklamanın en temiz ve en kolay yolu nedir? Sezgisel olarak ne anlama geliyor? Eğer biri bunu çocuklarına açıklayacaksa, nasıl olur? Bu, eklemlenmekte zorlandığım bir kavram - özellikle riske olan varyansla ilgili. Ben matematiksel olarak anlıyorum ve bu şekilde de açıklayabilirim. Fakat gerçek dünya fenomenini açıklarken, birisinin varyansı …

6
Bayesian güvenilir aralıklarının sık sık güven aralıklarının gerisinde kaldığı açıkça görülüyor mu?
Güven ve güvenilir aralıklar arasındaki fark hakkındaki son bir soru, Edwin Jaynes'in bu konuyla ilgili makalesini tekrar okumaya başlamamı sağladı: Jaynes, ET, 1976. “Olasılık Teorisi, İstatistiksel Çıkarım ve Bilimin İstatistiksel Teorileri, WL Harper ve CA Hooker (ed.), D. Reidel, Dordrecht, s. 175; ( pdf ) Özet olarak, Jaynes şöyle yazıyor: …



Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.