«r» etiketlenmiş sorular

Bu etiketi, (a) sorusunun kritik bir parçası veya beklenen yanıt olarak `` R '' içeren herhangi bir * on-topic * sorusu için kullanın, & (b) `` R`'nin nasıl kullanılacağı hakkında * sadece * değildir.

1
Lojistik regresyon modelinin değerlendirilmesi
Lojistik bir model üzerinde çalışıyorum ve sonuçları değerlendirmede bazı zorluklar yaşıyorum. Modelim bir binom logit. Açıklayıcı değişkenlerim: 15 seviyeli kategorik bir değişken, iki değişkenli ve 2 sürekli değişken. N harfim büyük> 8000. Firmaların yatırım yapma kararlarını modellemeye çalışıyorum. Bağımlı değişken yatırımdır (evet / hayır), 15 seviye değişkenleri yöneticiler tarafından bildirilen …

2
abstract.glm () içindeki dağılım
Tarafından bir glm.nb yürüttüm glm1<-glm.nb(x~factor(group)) grup bir kategorik ve x bir metrik değişken. Sonuçların özetini almaya çalıştığımda, summary()veya kullanmama bağlı olarak biraz farklı sonuçlar alıyorum summary.glm. summary(glm1)bana verir ... Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.1044 0.1519 0.687 0.4921 factor(gruppe)2 0.1580 0.2117 0.746 0.4555 factor(gruppe)3 0.3531 0.2085 1.693 …

4
Ağır kuyruklu dağıtımlar için boxplot eşdeğeri?
Yaklaşık olarak normal olarak dağıtılmış veriler için kutu grafikleri, medyanı ve verilerin yayılmasını ve ayrıca herhangi bir aykırı değerlerin varlığını hızlı bir şekilde görselleştirmenin harika bir yoludur. Bununla birlikte, daha ağır kuyruklu dağılımlar için, uç noktalar IQR'nin sabit faktörünün dışında olduğu tanımlandığından ve çok kuyruklu dağılımlarda elbette çok daha sık …



4
Haftalık anlamı koruyan influenza verilerinin enterpolasyonu
Düzenle Tam olarak ihtiyacım olan prosedürü açıklayan bir makale buldum . Tek fark, makalenin aylık ortalama verileri korurken, aylık ortalama verileri günlük olarak enterpolasyonlandırmasıdır. Yaklaşımı uygulamakta sorun yaşıyorum R. Herhangi bir ipucu takdir. orijinal Her hafta için aşağıdaki sayım verilerine sahibim (haftada bir değer): Doktor konsültasyon sayısı İnfluenza vakası sayısı …

3
R'de varimax döndürülmüş ana bileşenler nasıl hesaplanır?
PCA'yı 25 değişken üzerinde çalıştırdım ve kullanarak ilk 7 bilgisayarı seçtim prcomp. prc <- prcomp(pollutions, center=T, scale=T, retx=T) Daha sonra bu bileşenler üzerinde varimax rotasyonu yaptım. varimax7 <- varimax(prc$rotation[,1:7]) Ve şimdi varimax PCA döndürülmüş verileri döndürmek istiyorum (varimax nesnesinin bir parçası olmadığı için - sadece yükleme matrisi ve döndürme matrisi). …
13 r  pca  factor-rotation 

3
R'deki Büyük Verileri Kümele ve Örnekleme Alakalı mı?
Veri biliminde yeniyim ve R'de 200.000 satır ve 50 sütun içeren bir veri kümesinde kümeleri bulmakta sorun yaşıyorum. Verilerin hem sayısal hem de nominal değişkenleri olduğundan, Öklid uzaklık ölçüsü kullanan K-araçları gibi yöntemler uygun bir seçim gibi görünmemektedir. Bu yüzden bir mesafe matrisini girdi olarak kabul eden PAM, agnes ve …

2
Rastgele bir matris için SVD hiçbir şeyi açıklamamalı mı? Neyi yanlış yapıyorum?
Tamamen rastgele verilerden oluşan bir 2-D matris oluşturursam, PCA ve SVD bileşenlerinin temelde hiçbir şeyi açıklamamasını beklerdim. Bunun yerine, ilk SVD sütunu verilerin% 75'ini açıklıyor gibi görünüyor. Bu nasıl olabilir? Neyi yanlış yapıyorum? İşte konu: İşte R kodu: set.seed(1) rm(list=ls()) m <- matrix(runif(10000,min=0,max=25), nrow=100,ncol=100) svd1 <- svd(m, LINPACK=T) par(mfrow=c(1,4)) image(t(m)[,nrow(m):1]) …
13 r  pca  svd 

1
Lojistik regresyon tahminlerini anlama
Bir lojistik regresyon modelinden (R'de glm) gelen tahminlerim beklediğim gibi 0 ile 1 arasında sınırlı değil. Lojistik regresyon anlayışım, giriş ve model parametrelerinizin doğrusal olarak birleştirilmesi ve yanıtın logit link işlevi kullanılarak bir olasılığa dönüştürülmesidir. Logit işlevi 0 ile 1 arasında sınırlandığından, tahminlerimin 0 ile 1 arasında sınırlanmasını bekledim. Ancak …

2
Sürekli uzunlamasına ikili yanıtlar için bir R paketi var mı?
bildPaket seri ikili yanıtlar için mükemmel bir paket olarak görünmektedir. Ama ayrık bir zamandır. Geçerli yanıtın Y'nin daha erken zamanlarda ölçülen ikili yanıtlarla oran oranı bağlantısı veya bunun en azından birinci dereceden bir Markov versiyonu için yumuşak bir zaman fonksiyonu belirtmek istiyorum. Buna alternatif lojistik regresyon denir. Sürekli süreyi işleyen …

2
R'deki stokastik diferansiyel denklemler için sayısal çözücüler var mı?
Euler-Maruyama şemasını, Milstein şemasını (veya başka bir yöntemi) kullanarak (1) gibi homojen olmayan doğrusal olmayan bir difüzyon yollarını simüle etmek için genel, temiz ve hızlı (yani C ++ rutinleri kullanarak) R paketi arıyorum. Bu, daha büyük bir tahmin koduna gömülmeye yöneliktir ve bu nedenle optimize edilmeyi hak eder. dXt=f(θ,t,Xt)dt+g(θ,t,Xt)dWt,(1)(1)dXt=f(θ,t,Xt)dt+g(θ,t,Xt)dWt,dX_t = …

1
Doğrusal Regresyon ve Mekansal-Otokorelasyon
Uzaktan algılama yoluyla elde edilen bazı değişkenleri kullanarak belirli bir alandaki Tree Heights'ı tahmin etmek istiyorum. Yaklaşık Biyokütle, vb.Gibi ilk önce doğrusal bir regresyon kullanmak istiyorum (bunun en iyi fikir olmadığını biliyorum, ancak projem için bir zorunluluk adımdır). Uzamsal otokorelasyonun bunu ne kadar kötü etkileyebileceğini ve hatta mümkünse bunu düzeltmenin …

3
PCA bileşenleri gerçekten varyans yüzdesini temsil ediyor mu? Toplamı% 100'den fazla olabilir mi?
O'Reilly'nin "Hackerlar İçin Makine Öğrenmesi" her temel bileşenin varyansın bir yüzdesini temsil ettiğini söylüyor. Aşağıdaki sayfanın ilgili kısmını alıntıladım (bölüm 8, s.207). Başka bir uzmanla görüştüklerinde, bunun yüzde olduğunu kabul ettiler. Bununla birlikte, 24 bileşen% 133.2095'tir. Nasıl olabilir? Kendimizi PCA kullanabileceğimize ikna ettikten sonra, bunu R'de nasıl yapabiliriz? Yine, bu …
13 r  pca 

1
Bayes glm'deki -değerlerini anlamama yardım et
Burada veriler üzerinde bir Bayesian logit çalıştırmak çalışıyorum . R paketinde kullanıyorum bayesglm(). armKodlama yeterince basit: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df) summary(model) aşağıdaki çıktıyı verir: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.10381 0.10240 1.014 0.311 SEXMale 0.02408 0.09363 0.257 …
13 r  bayesian  p-value 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.