«generalized-linear-model» etiketlenmiş sorular

Bir "bağlantı fonksiyonu" yoluyla doğrusal olmayan ilişkilere ve yanıtın varyansının öngörülen değere bağlı olmasına izin veren doğrusal regresyonun genelleştirilmesi. (Sıradan doğrusal modeli genel kovaryans yapısına ve çok değişkenli yanıta genişleten "genel doğrusal model" ile karıştırılmamalıdır.)

4
Sayım verileri için uygun modele karar verme stratejisi
Sayım verileriyle hangi modelin kullanılacağına karar vermek için uygun strateji nedir? Ben çok düzeyli bir model olarak modellemek için gereken veri sayım var ve bunu (bu sitede) bunu yapmak için en iyi yolu böcek veya MCMCglmm olduğunu tavsiye edilmiştir. Ancak ben hala bayes istatistikleri hakkında bilgi edinmek için çalışıyorum, ve …

2
GLM neden dönüştürülmüş değişkenli LM'den farklı?
Bu ders notunda açıklandığı gibi (sayfa 1) , lineer bir model şu şekilde yazılabilir: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, burada cevap değişkendir ve bir x_ {i} olan i ^ {inci} açıklayıcı değişken.yyyxixix_{i}ithithi^{th} Genellikle test varsayımlarını karşılamak amacıyla, yanıt değişkeni dönüştürülebilir. Örneğin, günlük işlevini …

1
GLM'deki log olasılığı küresel maksimumlara yakınsamayı garantiledi mi?
Sorularım: Genelleştirilmiş doğrusal modellerin (GLM'ler) küresel bir maksimuma yaklaşması garanti ediliyor mu? Öyleyse neden? Ayrıca, konveksliği sağlamak için link fonksiyonunda ne gibi kısıtlamalar vardır? GLM'leri anladığım, oldukça doğrusal olmayan bir olasılık fonksiyonunu en üst düzeye çıkarmalarıdır. Böylece, birkaç yerel maxima olduğunu ve yakınsama parametre kümesi optimizasyon algoritması için başlangıç ​​koşullarına …


3
İstatistiksel altyapısı olmayan kişilere genelleştirilmiş doğrusal modelleri nasıl açıklarsınız?
İstatistiksel arka planı olmayan kitleye istatistiksel teknikleri açıklamakta her zaman zorlanırım. Böyle bir kitleye GLM'nin ne olduğunu açıklamak isteseydim (istatistiksel jargon çıkarmadan), en iyi ya da en etkili yol ne olurdu? Genelde GLM'yi üç bölümle açıklarım - (1) tepki değişkeni olan rastgele bileşen, (2) doğrusal öngörücüler olan sistematik bileşen ve …

2
GLM'lerde aşırı dağılım testleri gerçekten * faydalı mıdır?
Bir GLM'deki 'aşırı dağılım' olgusu, yanıt değişkeninin varyansını kısıtlayan bir model kullandığımızda ortaya çıkar ve veriler model kısıtlamasının izin verdiğinden daha fazla varyans gösterir. Bu, sayı verilerini bir Poisson GLM kullanarak modellerken yaygın olarak ortaya çıkar ve iyi bilinen testlerle teşhis edilebilir. Testler, aşırı dağılımın istatistiksel olarak önemli bir kanıtı …

3
Basit chi kare testi yerine glm () kullanımı
glm()R'de kullanılan sıfır hipotezlerini değiştirmekle ilgileniyorum. Örneğin: x = rbinom(100, 1, .7) summary(glm(x ~ 1, family = "binomial")) olduğu hipotezini test eder . Boş değeri p = içinde rasgele bir değere değiştirmek istersem ne olur ? p=0.5p=0.5p = 0.5pppglm() Ben bu konuda da yapılabilir biliyorum prop.test()ve chisq.test()ama kullanma fikrini keşfetmek …

4
Degrade artırıcı makine doğruluğu, yineleme sayısı arttıkça azalır
Gradyan arttırıcı makine algoritmasını caretR'deki paket üzerinden deniyorum. Küçük bir kolej veri kümesi kullanarak, aşağıdaki kodu koştu: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

2
Kovaryans yapısının belirlenmesi: artıları ve eksileri
Bir GLM'de bir kovaryans yapısının belirtilmesinin faydaları nelerdir (kovaryans matrisindeki diyagonal olmayan tüm girişleri sıfır olarak değerlendirmek yerine)? Verilerin bildiklerini yansıtmanın yanı sıra, uyum iyiliği artırmak? Bekletilen verilerde öngörme doğruluğu artırılsın mı? kovaryansın boyutunu tahmin etmemize izin verir mi? Kovaryans yapısının uygulanmasının maliyeti nedir? Yapar algoritmaları için hesaplama komplikasyonları eklemek? …

3
Negatif olmayan veriler için sıfırlar halinde toplanan bir model (Tweedie GLM, sıfır şişirilmiş GLM, vb.) Kesin sıfırları tahmin edebilir mi?
Bir Tweedie dağılımı, parametresi (ortalama-varyans ilişkisindeki üs) 1 ile 2 arasında olduğunda, çarpık bir nokta kütlesine sahip eğri verileri modelleyebilir .ppp Benzer şekilde sıfır şişirilmiş (aksi halde sürekli veya ayrık olsun) bir model çok sayıda sıfır içerebilir. Neden bu tür modellerle tahmin yaptığımda veya takılan değerleri hesapladığımda, tahmin edilen tüm …

3
GAM vs GLM ne zaman kullanılır?
Bunun potansiyel olarak geniş bir soru olabileceğini fark ettim, ama bir GLM (Genelleştirilmiş doğrusal model) üzerinde bir GAM (Genelleştirilmiş katkı modeli) kullanımını gösteren genelleştirilebilir varsayımlar olup olmadığını merak ediyordum. Birisi kısa süre önce bana GAM'ların yalnızca veri yapısının "katkı maddesi" olduğunu düşündüğümde kullanılması gerektiğini söyledi, yani x eklemelerinin y'yi tahmin …

2
Neden lineer regresyon rezidüel, ancak genelleştirilmiş lineer modelde varsayım vardır?
Neden doğrusal regresyon ve Genelleştirilmiş Model tutarsız varsayımlara sahiptir? Doğrusal regresyonda artık Gauss'tan gelir Diğer regresyonlarda (lojistik regresyon, zehir regresyonu), bazı dağılımlardan (binom, zehir vb.) Yanıt geldiğini varsayıyoruz . Neden bazen kalan ve diğer zamanın yanıt aldığını varsayıyoruz? Farklı özellikler elde etmek istediğimiz için mi? EDIT: mark999's iki form eşit …

1
Sadece 1 gözlemle rastgele etkiler genelleştirilmiş doğrusal karışık modeli nasıl etkiler?
Rasgele bir efekt olarak kullanmak istediğim değişkenin sadece bazı seviyeler için tek bir gözlemi olduğu bir veri setim var. Önceki soruların cevaplarına dayanarak, prensip olarak, bunun iyi olabileceğini topladım. Sadece 1 gözlemi olan deneklerle karışık bir model takabilir miyim? Rastgele engelleme modeli - konu başına bir ölçüm Ancak, ikinci linkte …

2
GLM: bir dağıtım ve bağlantı işlevi seçimini doğrulama
Gauss dağılımı ve log link fonksiyonunu benimseyen genelleştirilmiş doğrusal bir modelim var. Modeli yerleştirdikten sonra, kalıntıları kontrol ediyorum: QQ grafiği, kalıntılar ile tahmin edilen değerler, artıkların histogramı (dikkatli olunması gerektiğini kabul ederek). Her şey iyi gözüküyor. Bu, bana göre, bir Gauss dağılımı seçiminin oldukça makul olduğunu gösteriyor. Ya da en …

6
Bir etkinlikte bağımsız değişken olarak harcanan zaman
Doğrusal bir modelde bağımsız değişken olarak bir şey (örneğin, emzirme haftaları) yapmak için harcanan zamanı dahil etmek istiyorum. Bununla birlikte, bazı gözlemler davranışla hiç ilgilenmez. Onları 0 olarak kodlamak gerçekten doğru değildir, çünkü 0 niteliksel olarak> 0'dan herhangi bir değerden farklıdır (yani emzirmeyen kadınlar, çok uzun süre yapmayanlar bile, kadınlardan …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.