«regression-strategies» etiketlenmiş sorular

Regresyon Modelleme Stratejileri


7
Sürekli bir tahmin değişkeninden ayrılmanın faydası nedir?
Bir modelde kullanmadan önce, sürekli bir yordayıcı değişkenini almanın ve onu parçalara ayırmanın (örn. Quintiles) ne olduğunu merak ediyorum. Bana öyle geliyor ki değişkeni binerek bilgiyi kaybediyoruz. Bu sadece doğrusal olmayan etkileri modelleyebilmemiz için mi? Değişkeni sürekli tutsak ve gerçekten düz bir doğrusal ilişki olmasaydı verilere en iyi şekilde uyacak …



1
Bir modelden terim düştükten sonra uygun kalan serbestlik dereceleri
Bu sorunun etrafındaki tartışmaya ve özellikle Frank Harrell'in yorumuna, indirgenmiş bir modelde (yani, birkaç açıklayıcı değişkenin test edildiği ve reddedildiği bir varyans tahmininin) Ye'in Genelleştirilmiş Serbestlik Dereceleri kullanması gerektiği yorumunu yansıtıyorum . Profesör Harrell, bunun orijinal "tam" modelin (serbest bırakma modelinin) kalan serbestlik derecelerine (bir dizi değişkenin reddedildiği) son bir …

3
Lojistik regresyonun değerlendirilmesi ve Hosmer-Lemeshow Uyum İyiliği'nin yorumlanması
Hepimizin bildiği gibi, lojistik regresyon modelini değerlendirmek için 2 yöntem var ve çok farklı şeyler test ediyorlar. Öngörü gücü: Bağımsız değişkenleri temel alarak bağımlı değişkeni ne kadar iyi tahmin edebileceğinizi ölçen bir istatistik edinin. Tanınmış Sahte R ^ 2, McFadden (1974) ve Cox ve Snell'dir (1989). Uygunluk istatistikleri Test, modeli …

2
Son (üretime hazır) model tam verilerde mi yoksa sadece eğitim setinde mi eğitilmeli?
Eğitim setinde birkaç model eğittiğimi varsayalım, çapraz doğrulama setini ve test setinde ölçülen performansı kullanarak en iyisini seçtim. Şimdi son bir modelim var. Mevcut tüm verilerime veya sadece eğitim setinde eğitilmiş gemi çözümüne bakmalı mıyım? İkincisi, öyleyse neden? GÜNCELLEME: P.Windridge'in de belirttiği gibi, yeniden eğitilmiş bir modelin nakliyesi, temel olarak, …


2
Bayes düşünme hakkında aşırı düşünme
Geleneksel frekansçı istatistik alanındaki tahmin modellerini doğrulamak için yöntem ve yazılım geliştirmeye çok zaman ayırdım. Daha fazla Bayesci fikri hayata geçirirken ve öğretirken kucaklamak için bazı önemli farklılıklar görüyorum. Birincisi, Bayes öngörülü modelleme analistten aday özelliklerine göre özelleştirilebilen önceki dağılımlar hakkında çok düşünmesini ister ve bu öncelikler modeli kendilerine çeker …

2
LASSO, aynı sorunlardan adım adım geriliyor mu?
Kademeli algoritmik değişken seçim yöntemleri, regresyon modellerinde ( ve SE'leri, p -değerleri, F istatistikleri vb.) Her tahmini az veya çok eğilimli olan ve gerçek tahmin edicileri hariç tutma olasılığı yüksek olan modelleri seçme eğilimindedir oldukça olgun bir simülasyon literatürüne göre yanlış öngörücüler içerir.ββ\beta LASSO, değişkenleri seçmek için kullanıldığında aynı şekilde …

1
Örneklem büyüklüğünü rastgele bir değişken yapmak ne demektir?
Frank Harrell bir blog başlattı ( İstatistiksel Düşünme) . İlk yayınında , istatistiksel felsefesinin bazı temel özelliklerini listeler. Diğer öğelerin yanı sıra şunları içerir: Mümkünse örnek boyutunu rastgele bir değişken yapın "Örnek boyutunu rastgele değişken yapmak" ne anlama gelir? Bunu yapmanın avantajları nelerdir? Neden tercih edilebilir?

3
Hosmer ve ark. 2013. R Uygulamalı Lojistik Regresyon
Bu benim ilk yazı StackExchange, ama bir süredir kaynak olarak kullanıyorum, uygun formatı kullanmak ve uygun düzenlemeleri yapmak için elimden geleni yapacağım. Ayrıca, bu çok parçalı bir soru. Soruyu birkaç farklı gönderiye mi yoksa sadece bir tanesine mi bölmem gerektiğinden emin değildim. Soruların hepsi aynı metindeki bir bölümden geldiğinden, tek …

5
Doğrusal bir modelde anlamlı olmayan faktör düzeyleri için katsayıları göz ardı edebilir miyim?
Buradaki doğrusal model katsayıları hakkında açıklama yaptıktan sonra , faktör seviyesi katsayıları için önemsiz (yüksek p değeri) ile ilgili bir takip sorum var. Örnek: Doğrusal modelim 10 seviyeli bir faktör içeriyorsa ve bu düzeylerden sadece 3'ünde kendileriyle ilişkili önemli p değerleri varsa, modeli Y'yi tahmin etmek için kullanırken, özne önemsiz …

4
Hangi değişkenler hangi PCA bileşenlerini açıklar ya da tam tersi?
Bu verileri kullanma: head(USArrests) nrow(USArrests) Ben böyle bir PCA yapabilirsiniz: plot(USArrests) otherPCA <- princomp(USArrests) Yeni bileşenleri otherPCA$scores ve aşağıdaki bileşenlerle açıklanan varyans oranı summary(otherPCA) Ama hangi değişkenlerin çoğunlukla hangi temel bileşenler tarafından açıklandığını bilmek istersem? Ve tam tersi: örneğin PC1 veya PC2 en çok tarafından açıklanıyor murdermu? Bunu nasıl yapabilirim? …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.