İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

2
Ne zaman (ve neden) bir dağıtım günlüğünü (sayıların) almalısınız?
Örneğin, geçmiş hisse senedi fiyatları, havayolu bilet fiyatı dalgalanmaları, şirketin geçmiş finansal verileri gibi bazı geçmiş verilere sahibim ... Şimdi birileri (ya da bazı formüller) gelir ve "hadi dağıtım günlüğünü alalım / kullanalım" der ve işte NEREYE GİTİRİM ? Sorular: Niçin birincisi dağıtım günlüğünü almalı? Dağıtım günlüğü, orijinal dağıtımın yapamayacağı …

4
QQ grafiği nasıl yorumlanır?
Küçük bir veri kümesiyle (21 gözlem) çalışıyorum ve R'de aşağıdaki normal QQ grafiğine sahibim: Arsa’nın normalliği desteklemediğini görünce, altta yatan dağıtım hakkında ne çıkartabilirim? Bana öyle geliyor ki, sağa doğru eğilmiş bir dağılım daha iyi bir seçim olabilir, değil mi? Ayrıca, verilerden başka ne gibi sonuçlar çıkarabiliriz?

9
Neden tensörlerle ani büyülenme?
Son zamanlarda birçok insanın tensör eşdeğeri geliştirdiğini fark ettim (tensör faktörizasyonu, tensör çekirdekleri, konu modellemesi için tensörler, vb.) Merak ediyorum, neden dünya aniden tensörlerle büyülendi? Bu konuda ortaya çıkan özellikle şaşırtıcı olan son makaleler / standart sonuçlar var mı? Hesaplamalı olarak daha önce şüphelenilenden çok daha ucuz mu? Glib olmuyorum, …

3
Kement vs sırtını ne zaman kullanmalıyım?
Diyelim ki çok sayıda parametre tahmin etmek istiyorum ve bazılarını cezalandırmak istiyorum çünkü diğerlerine kıyasla daha az etkili olmaları gerektiğine inanıyorum. Hangi ceza planının kullanılacağına nasıl karar verebilirim? Sırt regresyonu ne zaman daha uygun olur? Kement'i ne zaman kullanmalıyım?



8
Lojistik regresyonda kusursuz ayrılıkla nasıl başa çıkılır?
Sıfırları ve hedef değişkendekileri mükemmel bir şekilde ayıran bir değişkeniniz varsa, R aşağıdaki "mükemmel veya yarı mükemmel ayrılma" uyarı mesajını verecektir: Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred Modeli hala alıyoruz, ancak katsayı tahminleri şişiriliyor. Bununla pratikte nasıl başa çıkıyorsunuz?


3
R lmer hile sayfası
Bu forumda, çeşitli hiyerarşik modelleri belirlemenin doğru yolu hakkında çok fazla tartışma var lmer. Tüm bilgilerin bir yerde olmasının harika olacağını düşündüm. Başlamak için birkaç soru: Nasıl bir grubun diğerini içinde yuvalanmış farklı seviyelerini belirlemek için: öyle (1|group1:group2)ya (1+group1|group2)? Arasındaki fark nedir (~1 + ....)ve (1 | ...)ve (0 | …

3
ROC ve hassas hatırlama eğrileri
Aralarındaki biçimsel farklılıkları anlıyorum, bilmek istediğim biri ile diğerini kullanmanın daha uygun olduğu zaman. Belirli bir sınıflandırma / tespit sisteminin performansı hakkında her zaman tamamlayıcı bir içgörü sağlıyorlar mı? İkisinin de bir gazetede sunulması ne zaman mantıklıdır? sadece bir tane yerine? Bir sınıflandırma sistemi için hem ROC hem de hassas …


2
Üretici ve ayrımcı
Üreticinin " 'ye dayalı" ve ayırımcı " göre" anlamına geldiğini biliyorum ancak birkaç noktada kafam karıştı:P(x,y)P(x,y)P(x,y)P(y|x)P(y|x)P(y|x) Wikipedia (+, web'deki diğer birçok isabet), SVM'ler ve karar ağaçları gibi şeyleri ayrımcı olarak sınıflandırıyor. Ancak bunların olasılıksal yorumları bile yok. Ayrımcı burada ne anlama geliyor? Ayrımcı sadece üretken olmayan bir şey ifade ediyor …



6
K-katlama çapraz doğrulama işleminden sonra öngörülü bir model nasıl seçilir?
K-kat çapraz doğrulama yaptıktan sonra prediktif bir model seçmeyi merak ediyorum. Bu garip bir şekilde ifade edilebilir, bu yüzden daha ayrıntılı olarak açıklamama izin verin: K-kat çapraz onaylamayı her çalıştırdığımda, eğitim verilerinin K altkümelerini kullanıyorum ve K farklı modellerle bitirdim. K modellerinden birini nasıl seçeceğimi bilmek istiyorum, böylece onu birisine …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.