«data-visualization» etiketlenmiş sorular

Verilerin anlamlı ve yararlı grafik gösterimlerinin oluşturulması. (Sorunuz yalnızca belirli bir efekti üretmek için belirli bir yazılımı nasıl alacağınızla ilgiliyse, muhtemelen burada konu ile ilgili değildir.)

8
R’de grafiksel verilere genel bakış (özet) işlevi
Daha önce bir R paketinde bunun gibi bir fonksiyonla karşılaştığımdan eminim, ancak kapsamlı Googling'ten sonra hiçbir yerde bulamıyorum. Düşündüğüm fonksiyon, kendisine verilen bir değişken için grafiksel bir özet üretti, bazı grafiklerle çıktı oluşturdu (histogram ve belki de bir kutu ve bıyık arsası) ve ortalama, SD vb. Bu işlevin R tabanına …

4
R ile çizim yapmak için, ggplot2 veya ggvis'i öğrenmeli miyim?
R ile çizim yapmak için, ggplot2 veya ggvis'i öğrenmeli miyim? Her ikisinden de birinin herhangi bir konuda üstün olup olmadığını öğrenmek istemiyorum. Neden R topluluğu örtüşen işlevlere sahip yeni paketler oluşturmaya devam ediyor? Tanıtım Blog yazısı ggvis sofistike komplo paket ggplot2 zaten var olduğu göz önüne alındığında oluşturulan neden tek …

3
PCA, boolean (binary) veri tipleri için çalışır mı?
Daha yüksek dereceli sistemlerin boyutsallığını azaltmak ve kovaryansın çoğunu tercihen 2 boyutlu veya 1 boyutlu bir alanda yakalamak istiyorum. Bunun ana bileşen analizi yoluyla yapılabileceğini biliyorum ve PCA'yı birçok senaryoda kullandım. Ancak, onu hiçbir zaman boolean veri türleriyle kullanmadım ve PCA'yı bu setle yapmanın anlamlı olup olmadığını merak ediyordum. Örneğin, …

5
Bir sinir ağının ne yaptığını görselleştirmek / anlamak?
Yapay sinir ağları genellikle karmaşık yapıları nedeniyle "kara kutular" olarak ele alınır. Bu, ideal değildir, çünkü bir modelin şirket içinde nasıl çalıştığını sezgisel bir şekilde kavramak faydalıdır. Eğitimli bir sinir ağının nasıl çalıştığını görselleştirme yöntemleri nelerdir? Alternatif olarak, ağın kolayca sindirilebilir tanımlarını nasıl çıkarabiliriz (örn. Bu gizli düğüm öncelikle bu …

2
T-SNE ne zaman yanıltıcıdır?
Yazarlardan birinden alıntı: t-Dağıtılmış Stokastik Komşu Gömme (t-SNE), boyutsallığın azaltılması için yüksek boyutlu veri kümelerinin görselleştirilmesi için özellikle uygun bir ( ödüllü ) tekniktir. Bu yüzden kulağa çok hoş geliyor, ama Yazar konuşuyor. Yazardan bir başka alıntı (yeniden: yukarıda belirtilen rekabet): Bu yarışmadan ne aldın? Tahmin edicileri veriler üzerinde çalışmaya …

3
Tufte tarzı görselleştirmeleri destekleyen deneysel kanıtlar?
S: Nigel Holmes'un grafiksel önemsiz görselleştirmeleri üzerindeki Tufte tarzı, minimalist, veri-konuşmalı görselleştirmelerini destekleyen deneysel kanıtlar var mı ? Buradaki R parsellerine nasıl grafik önemsiz ekleyeceğimi sordum ve yanıt verenler bana çok ağır bir miktar attılar. Bu nedenle, elbette, şahsi olmadığım, anti-grafik önemsiz konumlarını destekleyen --- sadece "Tufte öyle dedi" den …

4
Silhouette çizimi ne anlama gelir?
Veri setimdeki küme sayısını belirlemek için siluet grafiği kullanmaya çalışıyorum. Veri kümesi treni göz önüne alındığında, aşağıdaki matlab kodunu kullandım Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s = silhouette(Train_data,centroid,'sqeuclid'); Result = [ Result; num_of_cluster mean(s)]; end plot( Result(:,1),Result(:,2),'r*-.');` Ortaya çıkan arsa, küme sayısı …

3
Neden bir lojistik regresyonun% 95 güven aralığında manuel olarak hesaplanması ile R'deki confint () fonksiyonunun kullanılması arasında bir fark var?
Sevgili millet - Açıklayamayacağım tuhaf bir şey fark ettim, ya sen? Özetle: bir lojistik regresyon modelinde bir güven aralığı hesaplamaya yönelik manuel yaklaşım ve R işlevi confint()farklı sonuçlar verir. Hosmer ve Lemeshow'un Applied Logistic Regresyon (2. Basım) bölümünden geçiyorum . 3. bölümde, oran oranını ve% 95 güven aralığını hesaplama örneği …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
Poisson dağıtılmış veriler için bir kutu grafiği varyantı var mı?
Poisson dağıtılmış verilerine (ya da muhtemelen diğer dağıtımlara) uyarlanmış bir kutu grafiği varyantı olup olmadığını bilmek ister misiniz? Gauss dağılımında, L = Q1 - 1.5 IQR ve U = Q3 + 1.5 IQR’ya yerleştirilen bıyıklar, boxplot’ın kabaca yüksek aykırı değerler (L'nin altındaki noktalar) olduğu kadar kabaca (L'nin altındaki noktalar) olacağı …


2
Verileri görselleştirdikten sonra istatistiksel bir test yapmak - veri tarama?
Bu soruyu bir örnekle önereceğim. Sürekli ve kategorik değişkenlerim olan Boston'daki konut fiyat veri seti gibi bir veri setimin olduğunu varsayalım. Burada, 1-10 arasında bir "kalite" değişkeni ve satış fiyatı var. Verileri "düşük", "orta" ve "yüksek" kaliteli evlere (keyfi) kalite için kesikler oluşturarak ayırabilirim. Ardından, bu grupları kullanarak satış fiyatlarının …

5
Çizgi grafikleri için renk ve çizgi kalınlığı önerileri
Genel olarak haritalar, çokgenler ve genel olarak gölgeli bölgeler için renk dostu olmayan renk seçenekleri hakkında çok şey yazıldı (bkz. Örneğin http://colorbrewer2.org ). Çizgi renkleri ve çizgi grafikleri için değişen çizgi kalınlığı önerileri bulamadım. Hedefler: iç içe geçmiş olsalar bile çizgileri kolayca ayırt ederler çizgilerin en yaygın renk körlüğü formuna …

2
İstatistiki Öğrenim Unsurlarından en yakın k sınıf komşu sınıflayıcısının karar sınırı nasıl çizilir?
Trevor Hastie ve Robert Tibshirani & Jerome Friedman'ın ElemStatLearn "İstatistiksel Öğrenmenin Öğeleri: Veri Madenciliği, Çıkarım ve Tahmin. İkinci Basım" kitabında açıklanan grafiği oluşturmak istiyorum. Arsa: Bu kesin grafiği nasıl üretebileceğimi merak ediyorum R, özellikle sınır grafiğini ve ızgara grafiklerini ve hesaplamalarını not edin.

3
Bir milyon görselleştirme, PCA baskısı
Temel Bileşen Analizi'nin çıktısını yalnızca özet tablolardan daha fazla içgörü kazandıracak şekillerde görselleştirmek mümkün mü? Gözlem sayısı büyük olduğunda bunu yapmak mümkün mü, örneğin ~ 1e4? Ve bunu R [diğer ortamlar kabul edilir] 'de yapmak mümkün müdür?

8
Çok boyutlu verileri görselleştirmek için açık kaynaklı araçlar?
Gnuplot ve ggobi'nin yanı sıra , insanlar çok boyutlu verileri görselleştirmek için hangi açık kaynak araçlarını kullanıyor? Gnuplot az çok temel bir komplo paketidir. Ggobi gibi birçok güzel şey yapabilir: bir boyut boyunca veya ayrı koleksiyonlar arasında verileri canlandırmak katsayıları değiştiren doğrusal kombinasyonları canlandırmak Temel bileşenleri ve diğer dönüşümleri hesaplayabilir …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.