«regression» etiketlenmiş sorular

Bir (veya daha fazla) "bağımlı" değişken ile "bağımsız" değişken arasındaki ilişkiyi analiz etme teknikleri.


4
Kalıntılardaki çapraz düz çizgiler ve çoklu regresyon için uygun değerler grafiği
Verilerim için artıklarda garip kalıplar gözlemliyorum: [EDIT] İki değişken için kısmi regresyon grafikleri şunlardır: [EDIT2] PP Grafiği eklendi Dağıtım gayet iyi görünüyor (aşağıya bakınız) ama bu düz çizginin nereden gelebileceğine dair hiçbir fikrim yok. Herhangi bir fikir? [GÜNCELLEME 31.07] Kesinlikle haklısın, retweet sayısının gerçekten 0 olduğu vakalarım vardı ve bu …

2
Basit doğrusal regresyon sonuçlarının raporlanması: hangi bilgiler dahil edilmelidir?
Genstat'ta bazı (çok) basit doğrusal regresyon gerçekleştirdim ve raporumdaki çıktının özlü ve anlamlı bir özetini eklemek istiyorum. Tam olarak ne veya ne kadar bilgi içermem gerektiğinden emin değilim. Genstat çıkışımın ana bitleri şöyle görünür: Summary of analysis Source d.f. s.s. m.s. v.r. F pr. Regression 1 8128935. 8128935. 814.41 <.001 …

1
GLM için ne tür artıklar ve Cook mesafesi kullanılıyor?
Cook mesafesinin formülünün ne olduğunu bilen var mı? Orijinal Cook'un mesafe formülü öğrenci kalıntılarını kullanır, ancak R neden std kullanıyor? Cook'un bir GLM için mesafe grafiğini hesaplarken Pearson kalıntıları. Öğrenci kalıntılarının GLM'ler için tanımlanmadığını biliyorum, ancak Cook'un mesafesini hesaplamak için formül nasıl görünüyor? Aşağıdaki örneği varsayalım: numberofdrugs <- rcauchy(84, 10) …

1
Sınırlı kübik spline'lar ve cezalandırılmış spline'lar ne kadar farklıdır?
Çeşitli regresyon problemlerinde spline kullanımı hakkında çok şey okuyorum. Bazı kitaplar (örneğin Hodges Richly Parrametreli Doğrusal Modeller ) cezalandırılmış spline'lar önerir. Diğerleri (örneğin, Harrell Regresyon Modelleme Stratejileri ) kısıtlı kübik spline'ları tercih eder. Bunlar pratikte ne kadar farklı? Sık sık birini veya diğerini kullanmaktan çok farklı sonuçlar elde eder misiniz? …

1
“Önceden seyrek” terimi neyi ifade eder (FBProphet Paper)?
"Ölçekte Öngörü" (FBProphet öngörme aracı, bkz. Https://peerj.com/preprints/3190.pdf ) "Daha önce seyrek" terimiyle karşılaştım. Yazarlar , lojistik büyüme modelinde bir model parametresi olan bazı skaler oran hız sapması vektörünü modellemede böyle bir "seyrek öncekini" kullandıklarını açıklarlar .δδ\mathbf{\delta}kkk Bunlar belirttiği gibi bu , bir parametre ise "seyrek", sıfıra yakın elemanlarını taşıyan vektöre …

1
R'deki her tahmin için regresyondaki güven puanlarını (rastgele ormanlarla / XGBoost ile) nasıl hesaplayabilirim?
Rastgele Ormanlar veya Aşırı Gradient Boosting (XGBoost) gibi algoritmaları kullanırken, tahmin edilen her değer için bir güven puanı almanın bir yolu var mı (buna güven değeri veya olasılığı da diyebiliriz)? Diyelim ki bu güven puanı 0 ile 1 arasında değişiyor ve belirli bir tahminden ne kadar emin olduğumu gösteriyor . …

3
Tek sıcak kodlama ile sahte kodlama arasındaki sorunlar
K seviyeli kategorik değişkenlerin kukla kodlamada k-1 değişkenleri ile kodlanması gerektiğinin farkındayım (benzer şekilde çok değerli kategorik değişkenler için). Çoğunlukla doğrusal regresyon, cezalandırılmış doğrusal regresyon (Kement, Ridge, Elastik Ağ), ağaç tabanlı (rastgele ormanlar) için farklı regresyon yöntemleri için kukla kodlama üzerinde bir sıcak kodlama (yani bunun yerine k değişkenlerini kullanarak) …

3
Kademeli regresyonun avantajları nelerdir?
Soruna yaklaşımımdaki çeşitlilik uğruna adım adım gerileme deniyorum. 2 sorum var: Kademeli regresyonun avantajları nelerdir? Özel güçlü yanları nelerdir? Özellikleri seçmek için aşamalı regresyon kullandığınız ve daha sonra seçilen tüm özellikleri bir arada alarak düzenli regresyon uyguladığınız hibrit yaklaşım hakkında ne düşünüyorsunuz?

2
Artımlı Gauss Süreci Regresyonu
Bir akış yoluyla tek tek gelen veri noktaları üzerinde kayan bir pencere kullanarak artımlı bir gauss işlemi regresyonu uygulamak istiyorum. İzin Vermek dddgirdi uzayının boyutsallığını gösterir. Yani, her veri noktasıxbenxix_iyer alır elemanların sayısı.ddd sürgülü pencerenin boyutu olsun .nnn Tahminler yapmak için, bir gram matris tersini hesaplamak için gereken , k …

5
Durbin Watson test istatistiği
DW testini R'deki regresyon modelime uyguladım ve DW test istatistiği 1.78 ve p değeri 2.2e-16 = 0 aldım. Bu, artıklar arasında otokorelasyon olmadığı anlamına mı gelir, çünkü stat küçük bir p değeriyle 2'ye yakındır veya stat 2'ye yakın olmasına rağmen p değeri küçüktür ve bu nedenle var olan sıfır hipotezini …


1
Doğrusal regresyonda normalite varsayımı
Doğrusal regresyonun bir varsayımı olarak, hatanın dağılımının normalliği bazen yanlış bir şekilde "genişletilir" veya y veya x'in normalliğine duyulan ihtiyaç olarak yorumlanır. X ve Y'nin normal olmadığı, ancak hata teriminin olduğu ve dolayısıyla elde edilen doğrusal regresyon tahminlerinin geçerli olduğu bir senaryo / veri seti oluşturmak mümkün müdür?

1
Çekirdek Sırtı Regresyon Verimliliği
Ridge Regresyonu burada öngörülen etikettir , , matris tanımlamak biz için bir etiket bulmaya çalışıyorsanız nesne ve matrisi nesnelerin şöyle:y^=(X′X+aId)−1Xxy^=(X′X+aId)−1Xx\hat{y} = (\mathbf{X'X} + a\mathbf{I}_d)^{-1}\mathbf{X}xy^y^\hat{y}IdId\mathbf{I}_dd×dd×dd \times dxx\mathbf{x}XX\mathbf{X}n×dn×dn \times dnnnxi=(xi,1,...,xi,d)∈Rdxi=(xi,1,...,xi,d)∈Rd\mathbf{x}_i = (x_{i,1}, ..., x_{i,d})\in \mathbb{R}^d X=⎛⎝⎜⎜⎜⎜⎜x1,1x2,1⋮xn , 1x1 ,2x2 ,2⋮x1 , 2……⋱...x1 , dx2 , d⋮xn , d⎞⎠⎟⎟⎟⎟⎟X=(x1,1x1,2…x1,dx2,1x2,2…x2,d⋮⋮⋱⋮xn,1x1,2…xn,d) \mathbf{X} = \begin{pmatrix} x_{1,1} …

2
Gruplandırılmış verilerde rastgele orman
Hiyerarşik bir yapıya sahip yüksek boyutlu gruplanmış verilerde (50 sayısal giriş değişkeni) rastgele orman kullanıyorum. Veriler, 70 farklı nesnenin 30 pozisyonunda 6 replikasyon ile toplanmış ve sonuçta 12600 veri noktası elde edilmiştir ve bunlar bağımsız değildir. Oob hatası, eğitim sırasında bir nesneden veri bırakırken ve sonra dışarıda bırakılan nesnenin sonucunu …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.