«modeling» etiketlenmiş sorular

Bu etiket, bir istatistiksel veya makine öğrenimi modeli oluşturma işlemini açıklar. Her zaman daha belirgin bir etiket ekleyin.

9
Analizler genellikle laymenler tarafından yapıldığında, bir modelde model varsayımı ve değerlendirmenin önemini abartıyor muyuz?
Sonuç olarak , istatistikler hakkında ne kadar çok şey öğrenirsem, o alanda yayınlanmış makalelere o kadar az güvenirim; Araştırmacıların istatistiklerini yeterince iyi yapmadıklarına inanıyorum. Ben bir meslektenim, tabiri caizse. Biyoloji eğitimi aldım ancak istatistik ya da matematik alanında örgün bir eğitimim yok. R'den zevk alıyorum ve araştırma yaparken uyguladığım yöntemlerin …

5
Regresyonları anlama - modelin rolü
Parametrelerini almaya çalıştığınız işlevi bilmiyorsanız, regresyon modeli nasıl kullanılabilir? Çocuklarını emziren annelerin daha sonraki yaşamlarda diyabet geçirme ihtimalinin daha düşük olduğunu söyleyen bir araştırma parçası gördüm. Araştırma yaklaşık 1000 anneden yapılan bir ankete aitti ve çeşitli faktörler için kontrol edildi ve bir loglinear model kullanıldı. Şimdi bu, diyabet olasılığını belirleyen …

8
Tüm modeller işe yaramaz mı? Herhangi bir model mümkün mü - veya faydalı mı?
Bu soru aklımda bir aydır iltihaplanma olmuştur. Amstat News'in Şubat 2015 sayısında Berkeley Profesörü Mark van der Laan'ın insanları yanlış model kullanmaları için azarlayan bir makalesi var . Modelleri kullanarak istatistiklerin bir bilimden ziyade bir sanat olduğunu belirtiyor. Ona göre, kişi her zaman “kesin modeli” kullanabilir ve bunu yapmamamızın “titizlik …

4
İstatistiksel modeller cheat sheet
Herhangi bir veya daha fazla bilgiyi listeleyen bir istatistiksel modelin "cheat sheet (s)" olup olmadığını merak ediyordum: model ne zaman kullanılır model kullanılmadığında gerekli ve isteğe bağlı girişler beklenen çıktılar Model farklı alanlarda (politika, biyo, mühendislik, imalat vb.) test edildi mi? uygulamada veya araştırmada kabul edilir mi? Beklenen değişim / …

2
Negatif Binom Dağılımı içindeki parametreleri anlama
Verilerimi çeşitli modellere sığdırmaya çalışıyordum ve fitdistrkütüphanedeki işlevin bana en iyi MASSsonucu Rverdiğini anladım Negative Binomial. Şimdi wiki sayfasından, tanım şöyle verilir: NegBin (r, p) dağılımı, son denemede başarı ile sonuçlanan k + r Bernoulli (p) denemelerinde k başarısızlık ve r başarı olasılığını tanımlar. RModel uydurma gerçekleştirmek için kullanmak bana …

7
Çoklu doğrusal regresyon modeline dahil edilecek değişkenleri seçme
Şu anda çoklu doğrusal regresyon kullanarak bir model oluşturmak için çalışıyorum. Modelimle uğraştıktan sonra, hangi değişkenleri koruyacağımı ve hangilerini kaldıracağımı en iyi nasıl belirleyeceğime emin değilim. Modelim DV için 10 belirteçle başladı. 10 öngörücüyü de kullanırken, dördü önemli olarak kabul edildi. Açıkça yanlış olan tahmin edicilerin sadece bir kısmını kaldırırsam, …

5
Etkileşim etkilerinin tanımlanmasında en iyi yöntemler nelerdir?
Bir modeldeki ( x1:x2veya x1*x2 ... xn-1 * xn) değişkenlerin olası her bir birleşiminin tam anlamıyla test edilmesi dışında . Bağımsız (umarım) değişkenleriniz arasında bir etkileşim olması gerektiğini veya COULD'un var olup olmadığını nasıl anlarsınız? Etkileşimleri belirlemeye çalışırken en iyi yöntemler nelerdir? Kullanabileceğiniz veya kullanabileceğiniz bir grafik tekniği var mı?

3
ARIMAX modeline R nasıl takılır?
Dört farklı zaman aralığında saatlik ölçümlerim var: Bir evin içindeki ısı tüketimi Evin dışındaki sıcaklık Güneş radyasyonu Rüzgar hızı Evin içindeki ısı tüketimini tahmin edebilmek istiyorum. Hem yıllık bazda hem de günlük bazda net bir mevsimsel eğilim vardır. Farklı seriler arasında açık bir ilişki olduğu için, onlara bir ARIMAX modeli …

1
Negatif binom regresyon sorusu - Zayıf bir model midir?
Sellers ve Shmueli tarafından sayım verileri için regresyon modelleriyle ilgili çok ilginç bir makale okuyorum . Başlangıçta (p. 944) McCullaugh ve Nelder'den (1989) negatif binom regresyonunun popüler olmadığını ve sorunlu bir kanonik bağı olduğunu söyleyerek alıntı yaparlar . Belirtilen pasajı buldum ve şöyle diyor (s. 374, M ve N) "Uygulamalarda …

3
Değişken seçimi neden gerekli?
Ortak veri tabanlı değişken seçim prosedürleri (örneğin, ileri, geri, kademeli, tüm alt kümeler) aşağıdakiler dahil olmak üzere istenmeyen özelliklere sahip modeller sağlama eğilimindedir: Katsayılar sıfırdan uzağa eğilimlidir. Çok küçük olan standart hatalar ve çok dar olan güven aralıkları. Reklamı yapılan anlamı olmayan test istatistikleri ve p değerleri. Aşırı iyimser olan …

2
SVM algoritmasının arkasındaki istatistiksel model nedir?
Modele dayalı bir yaklaşım kullanarak veriyle uğraşırken ilk adımın veri prosedürünü istatistiksel bir model olarak modellemek olduğunu öğrendim. Ardından bir sonraki adım bu istatistiksel modele dayanan verimli / hızlı çıkarım / öğrenme algoritması geliştirmektir. Bu yüzden hangi istatistiksel modelin destek vektör makinesi (SVM) algoritmasının arkasında olduğunu sormak istiyorum.


1
Bir lmer modelden etkilerin tekrarlanabilirliğinin hesaplanması
Bu yazıda , karışık etki modellemesi ile bir ölçümün tekrarlanabilirliğini (diğer bir deyişle güvenilirlik, sınıf içi korelasyon) nasıl hesaplayacağımı anladım . R kodu şöyle olurdu: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 


6
ROC AUC ve F1 puanı arasında nasıl seçim yapabilirim?
Geçenlerde, rekabet şartlarına göre roc auc puanının kullanıldığı bir Kaggle yarışmasını tamamladım. Bu projeden önce normalde model performansını ölçmek için f1 puanını metrik olarak kullandım. İleride, bu iki ölçüm arasında nasıl seçim yapmalıyım acaba? Ne zaman kullanılır ve hangi avantajları ve dezavantajları nelerdir? BTW, burada makaleyi okudum AUC ve F1 …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.