İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

2
Modelimi lmer'da doğru bir şekilde belirttim mi?
Birçok yardım sitesini araştırdım ve karışık bir modelde daha karmaşık iç içe terimlerin nasıl belirleneceği konusunda kafam hala karıştı. Ayrıca kullanımı gibi karıştı :ve /ve |etkileşimleri belirterek kullanarak rasgele faktörlerle yuva içinde lmer()de lme4yer pakette R. Bu sorunun amacı için, verilerimi bu standart istatistiksel modelle doğru şekilde tasvir ettiğimi varsayalım: …

5
Regresyona gecikmeli bağımlı değişkenin dahil edilmesi
Regresyon modeline gecikmeli bir bağımlı değişken eklemenin yasal olup olmadığı konusunda kafam çok karıştı. Temel olarak, eğer bu model Y'deki değişim ile diğer bağımsız değişkenler arasındaki ilişkiye odaklanırsa sağ tarafa gecikmeli bir bağımlı değişken eklemek, diğer IV'lerden önceki katsayıların Y'nin önceki değerlerinden bağımsız olduğunu garanti edebilir. Bazıları LDV'nin dahil edilmesinin …

4
Binom, negatif binom ve Poisson regresyonu arasındaki fark
Binom, negatif binom ve Poisson regresyonu arasındaki fark ve bu regresyonun hangi durumlar için en uygun olduğu ile ilgili bazı bilgiler arıyorum. SPSS'de yapabileceğim, bu gerilemelerden hangisinin durumum için en iyisi olduğunu söyleyebilecek herhangi bir test var mı? Ayrıca, regresyon kısmında görebileceğim bir seçenek olmadığından, SPSS'de nasıl Poisson veya negatif …


4
Dahili ve harici çapraz doğrulama ve model seçimi
Anladığım kadarıyla çapraz doğrulama ve model seçimi ile iki şeyi ele almaya çalışıyoruz: P1 . Örneğimizle antrenman yaparken popülasyonda beklenen zararı tahmin et P2 . Bu tahmin konusundaki belirsizliğimizi ölçün ve rapor edin (varyans, güven aralıkları, önyargı vb.) Standart uygulama, tekrarlayan çapraz doğrulama yapmak gibi görünmektedir, çünkü bu tahmin edicimizin …

2
Logit değeri aslında ne anlama geliyor?
Birçok durumda 0 ile 1 arasında bir sayı içeren bir logit modelim var, ancak bunu nasıl yorumlayabiliriz? 0.20 logit ile bir dava alalım Bir vakanın B grubuna karşı A grubuna ait olma ihtimalinin% 20 olduğunu iddia edebilir miyiz? logit değerini yorumlamanın doğru yolu bu mu?

2
Karede, cv ve yinelenen cv arasındaki gerçek fark nedir?
Bu, Caret yeniden örnekleme yöntemlerini sorgulamaya benzer , ancak bu sorunun bir kısmını gerçekten kararlaştırılmış bir şekilde yanıtlamadı. caret'in tren fonksiyonu sunuyor cvve repeatedcv. Söylemedeki fark nedir: MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) vs MyTrainControl=trainControl( method = "repeatedcv", number=5, repeats=5 ) cvK-folds (parametresi number) kümesini kırar anlıyorum ve daha …

4
Hem sürekli hem de kategorik özelliklerle öngörüde bulunmak
Bazı prediktif modelleme teknikleri, sürekli prediktörlerin kullanımı için daha fazla tasarlanmıştır, diğerleri ise kategorik veya ayrık değişkenlerin ele alınması için daha iyidir. Elbette bir tipi diğerine dönüştürme teknikleri var (ayrıklaştırma, yapay değişkenler, vs.). Ancak, her iki giriş türünü aynı anda, özelliklerin türünü değiştirmeden aynı anda ele almak üzere tasarlanmış öngörücü …

1
PCA, LDA, CCA ve PLS
PCA, LDA, CCA ve PLS arasında nasıl bir ilişki var? Hepsi "spektral" ve lineer cebirsel ve çok iyi anlaşılmış görünüyorlar (çevrelerinde inşa edilmiş 50+ yıl teorisi). Çok farklı şeyler için kullanılırlar (boyutsallığın azaltılması için PCA, sınıflandırma için LDA, regresyon için PLS) ama yine de çok yakın bir ilişki içinde olduklarını …

1
Gauss modelinde en küçük kareler ve MLE arasındaki denklik
Makine Öğrenimi konusunda yeniyim ve kendi başıma öğrenmeye çalışıyorum. Son zamanlarda bazı ders notlarını okuyordum ve temel bir sorum vardı. 13 no'lu slaytta “En Küçük Kare Tahmini Gauss modelinde Maksimum Olabilirlik Tahmini” ile aynıdır. Basit bir şey gibi görünüyor, ama bunu göremiyorum. Biri lütfen burada neler olduğunu açıklayabilir mi? Matematiği …

6
Birden fazla zaman serisinde aynı modeli tahmin etmek
Zaman serilerinde acemi bir geçmişe sahibim (bazı ARIMA tahmini / tahmini) ve tam olarak anlamadığım bir problemle karşı karşıyayım. Herhangi bir yardım çok takdir edilecektir. Hepsi aynı zaman aralığında ve hepsi aynı frekansta, hepsi benzer bir veri tipini tanımlayan çoklu zaman serilerini analiz ediyorum. Her seri yalnızca bir değişkendir, bakacağım …



4
Özellik sayısı ve gözlem sayısı
Özellik sayısı ile "sağlam" bir sınıflayıcı yetiştirmek için gereken gözlem sayısı arasındaki ilişki hakkında herhangi bir makale / kitap / fikir var mı? Örneğin, bir eğitim seti olarak iki sınıftan 1000 özellik ve 10 gözlem, ve bir test seti olarak diğer 10 gözlemim olduğunu varsayalım. Bazı sınıflandırıcı X'i eğitiyorum ve …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.