«data-visualization» etiketlenmiş sorular

Verilerin anlamlı ve yararlı grafik gösterimlerinin oluşturulması. (Sorunuz yalnızca belirli bir efekti üretmek için belirli bir yazılımı nasıl alacağınızla ilgiliyse, muhtemelen burada konu ile ilgili değildir.)

3
Verilerim hangi dağıtımı takip ediyor?
Diyelim ki 1000 bileşenim olduğunu ve bu girişlerin kaç kez başarısız olduğunu ve her girişimde hata verdiğine dair veri topladığımı varsayalım, ayrıca ekibimin sorunu çözmesinin ne kadar sürdüğünü de izliyorum. Kısacası, bu 1000 bileşenin her biri için onarım süresini (saniye olarak) kaydediyorum. Veriler bu sorunun sonunda verilmiştir. Tüm bu değerleri …

7
Milyonlarca puan varken verileri daha verimli bir şekilde çizmek için istatistiksel yöntemler?
Milyonlarca puan varken R'nin araziler üretmesinin uzun zaman alabildiğini görüyorum - puanların ayrı ayrı çizilmesi şaşırtıcı değil. Ayrıca, bu tür araziler çoğu zaman fazla dağınıktır ve kullanışlı olması için yoğundur. Noktaların çoğu örtüşür ve siyah bir kütle oluşturur ve bu kütleye daha fazla nokta çizmek için çok zaman harcanır. Standart …

3
Verileri işlemden ayıran bir dağılım grafiği oluşturmak için R'yi kullanmanın iyi bir yolu nedir?
Genel olarak R ve istatistikler konusunda çok yeniyim, ancak kendi yerel kapasitelerinin ötesinde olabileceğini düşündüğüm bir dağılım çizmem gerekiyor. Birkaç gözlem vektörüne sahibim ve onlarla bir dağılım grafiği oluşturmak istiyorum ve her bir çift üç kategoriden birine giriyor. Her kategoriyi renkli veya sembolle ayıran bir saçılma grafiği yapmak istiyorum. Bunun …

4
Sınıf dengesizliği altında Precision-Recall eğrileri için optimizasyon
Birkaç belirleyiciye sahip olduğum (biri en bilgilendirici olan) bir sınıflandırma görevim var ve sınıflandırıcımı oluşturmak için MARS modelini kullanıyorum (herhangi bir basit modelle ilgileniyorum ve açıklama amacıyla glms kullanmak çok iyi). Şimdi eğitim verilerinde çok büyük bir sınıf dengesizliği var (her pozitif örnek için yaklaşık 2700 negatif örnek). Bilgi Edinme …

6
Çizgi grafikte çok fazla çizgi var, daha iyi bir çözüm var mı?
Zaman içinde, kullanıcıların (bu durumda, "beğenmeler") eylemlerinin sayısını grafik çizmeye çalışıyorum. Dolayısıyla, y eksenim olarak "işlem sayısı" var, x eksenim zaman (hafta) ve her satır bir kullanıcıyı temsil ediyor. Benim sorunum bu verilere yaklaşık 100 kullanıcı grubu için bakmak istiyorum. Bir çizgi grafiği hızla 100 çizgi ile karışık bir karışıklık …

3
Birçok kümenin kesişme noktalarını görselleştirme
Birçok kümenin kesişme örtüşmesini göstermek için iyi bir görselleştirme modeli var mı? Venn diyagramları gibi bir şey düşünüyorum ama bu bir şekilde 10 veya daha fazla gibi daha büyük setlere kendini daha iyi borç verebilir. Wikipedia bazı daha yüksek Venn şemalarını gösteriyor ancak 4 set şeması bile içeri girecek çok …

2
Temel bileşen analizinde biplotların yorumlanması
Bu güzel derse rastladım: R Kullanarak İstatistiksel Analiz El Kitabı. Bölüm 13. Temel Bileşen Analizi: PCA'nın R dilinde nasıl yapıldığına dair Olimpik Heptatlon . Şekil 13.3'ün yorumunu anlamıyorum: Bu yüzden ilk özvektöre karşı ikinci özvektöre komplo yapıyorum. Bu ne anlama geliyor? Birinci özvektöre karşılık gelen özdeğerin, veri kümesindeki değişimin% 60'ını …


3
İki veya daha fazla regresyon modelindeki eğimleri karşılaştırmak için hangi testi kullanabilirim?
İki değişkenin cevabını bir tahminciye cevap olarak test etmek istiyorum. İşte minimal bir çoğaltılabilir örnek. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ Petal.Width, data = iris, …

1
Bir lmer modelden etkilerin tekrarlanabilirliğinin hesaplanması
Bu yazıda , karışık etki modellemesi ile bir ölçümün tekrarlanabilirliğini (diğer bir deyişle güvenilirlik, sınıf içi korelasyon) nasıl hesaplayacağımı anladım . R kodu şöyle olurdu: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

6
Pasta grafiklerle ilgili sorunlar
Pasta grafikleri hakkında artan tartışmalar var gibi görünüyor. Buna karşı ana argümanlar şöyle görünüyor: Alan uzunluktan daha az güçle algılanır. Pasta grafiklerde veri noktası-piksel oranı çok düşük Ancak, oranlarını resmederken bir şekilde faydalı olabileceğini düşünüyorum. Çoğu durumda masa kullanmayı kabul ediyorum, ancak bir iş raporu yazarken ve neden yüzlerce tablo …

6
Kırılmış eksenlere alternatifler nelerdir?
Kullanıcılar genellikle aynı grafikte farklı büyüklükteki siparişlerin verilerini sunmak için eksen değerlerini kırmaya çalışırlar ( buraya bakın ). Bu uygun olsa da, verileri görüntülemek için her zaman tercih edilen yol değildir (en iyi ihtimalle yanıltıcı olabilir). Farklı büyüklük derecelerinde farklı olan verileri göstermenin alternatif yolları nelerdir? Verileri log-dönüştürmek veya kafes …

4
Neden colormap viridis'i jet üzerinde kullanıyorsunuz?
Https://www.youtube.com/watch?v=xAoljeRJ3lU’da açıklandığı gibi , Matplotlib varsayılan renk haritasını jetten viridis’e değiştirir. Ancak, pek iyi anlamıyorum. Belki de renk körü olduğum için? Orijinal colormap jet çok güçlü görünüyor, kontrastı hissedebiliyorum: Yeni colormap viridis bu kontrasttan yoksun olsa da: Birisi lütfen benim için daha basit açıklayabilir misiniz? Makalem için arsaya ihtiyacım var. …

4
R'de görsel olarak çekici yoğunluklu ısı haritaları oluşturma
R'de ısı haritaları oluşturmak için bir dizi fonksiyon olduğunu bilmeme rağmen, sorun görsel olarak çekici haritalar üretemem. Örneğin, aşağıdaki resimlerden kaçınmak istediğim iyi ısı haritaları örnekleri. Birincisi açıkça ayrıntıdan yoksun, diğeri (aynı noktalara dayanarak) faydalı olamayacak kadar ayrıntılı. Her iki grafik de spatstat R paketindeki density () işleviyle oluşturulmuştur . …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.