«data-visualization» etiketlenmiş sorular

Verilerin anlamlı ve yararlı grafik gösterimlerinin oluşturulması. (Sorunuz yalnızca belirli bir efekti üretmek için belirli bir yazılımı nasıl alacağınızla ilgiliyse, muhtemelen burada konu ile ilgili değildir.)


6
Bir serideki veri noktalarının sayısını nasıl azaltabilirim?
10 yılı aşkın bir süredir istatistik okumadım (ve sonra sadece temel bir kurs), bu yüzden belki de sorumu anlamak biraz zor. Her neyse, yapmak istediğim bir serideki veri noktalarının sayısını azaltmak. X ekseni, ölçümün başlamasından bu yana geçen milisaniye sayısıdır ve y ekseni bu noktanın okumasıdır. Genellikle binlerce veri noktası …

2
Simpson Paradoksu, gizli bir değişkenin tüm tersine çevirme örneklerini kapsıyor mu?
Aşağıda, Simpson paradoksunun varlığına dair 'resimle kanıt' olarak sunulan birçok görselleştirme ve muhtemelen terminoloji ile ilgili bir soru yer almaktadır. Simpson Paradoksu, nümerik örnekleri tanımlamak ve vermek için oldukça basit bir olgudur (bunun olmasının nedeni derin ve ilginçtir). Paradoks, marjinal ilişkinin her koşullu ilişkiden farklı bir yöne sahip olduğu 2x2x2 …

1
Kutu arsa çentikleri ve Tukey-Kramer aralığı
'R' içindeki kutu grafiğindeki "notch" yardım belgesi ( veya orijinal metin ) aşağıdakileri verir: İki parselin çentikleri üst üste gelmezse, bu iki medyanın farklı olduğuna dair 'güçlü kanıttır' (Chambers et al, 1983, s. 62). Kullanılan hesaplamalar için boxplot.stats sayfasına bakın. ve ' boxplot.stats ' aşağıdakileri verir: Çentikler (istenirse) +/- 1.58 …

1
Öngörülen değerleri ARIMA zaman serisinde R olarak çizme
Bu soruda muhtemelen birden fazla ciddi yanlış anlama vardır, ancak hesaplamaları doğru yapmak değil, zaman serisi öğrenmeyi akılda tutarak motive etmek içindir. Zaman serilerinin uygulanışını anlamaya çalışırken, verilerin eğiliminin düşürülmesi gelecekteki değerlerin tahmin edilmesini mantıklı kılıyor gibi görünüyor. Örneğin gtemp, astsapaketteki zaman serileri şöyle görünür: Gelecek on yıllardaki artış eğilimi, …


1
PCA ile sadece büyük çift mesafeleri koruyarak ne kastedilmektedir?
Şu anda t-SNE görselleştirme tekniğini okuyorum ve yüksek boyutlu verileri görselleştirmek için temel bileşen analizini (PCA) kullanmanın dezavantajlarından birinin, noktalar arasındaki sadece büyük çift mesafeleri koruduğu belirtildi. Yüksek boyutlu uzayda birbirinden ayrı olan anlam noktaları, düşük boyutlu altuzayda da çok farklı görünecektir, ancak diğer tüm çift mesafeler vidalanacaktır. Birisi bunun …


3
“R” de grafik kümelemeye yaklaşım ve örnek
'R' grafik kümeleme kullanarak bir grafikte düğüm / birleştirme düğümleri arıyorum. İşte benim sorunumun şaşırtıcı bir oyuncak varyasyonu. İki "küme" vardır Kümeleri birbirine bağlayan bir "köprü" var İşte bir aday ağı: Bağlantı mesafesine baktığımda, "hopcount", eğer isterseniz, o zaman aşağıdaki matrisi alabilirim: mymatrix <- rbind( c(1,1,2,3,3,3,2,1,1,1), c(1,1,1,2,2,2,1,1,1,1), c(2,1,1,1,1,1,1,1,2,2), c(3,2,1,1,1,1,1,2,3,3), c(3,2,1,1,1,1,1,2,3,3), …

2
Giriş sayısı ile birlikte yüzdelerin nasıl görselleştirileceği.
Aşağıdaki tabloyu görselleştirmenin ve tedaviyi deneyen hasta sayısına göre tedavi etkinliğini vurgulamanın en iyi yolunu bulmaya çalışıyorum. Asıl sayfanın bağlantısı: http://curetogether.com/cluster-headaches/treatments/ Tedavileri karşılaştırmayı ve kaç hastanın her birini derecelendirdiğini görmeyi kolaylaştırırken etkinliği vurgulamanın en iyi yolu nedir? Düşüncem, etkinliği yüzde olarak göstermekti, ancak bunları nasıl kolayca karşılaştırılabilir hale getireceğinden ve …

3
Büyük N, ayrık veriler ve birçok değişkeniniz olduğunda, dağılım grafiği matrisinden nasıl bilgi alınır?
Meme kanseri veri kümesiyle oynuyorum ve hangilerinin (kırmızı) sınıfını malignant(mavi) tahmin etmede en fazla etkiye sahip olduğu hakkında bir fikir edinmek için tüm niteliklerin bir dağılım grafiğini oluşturdum benign. Satırın x eksenini ve sütunun y eksenini temsil ettiğini anlıyorum, ancak veriler veya bu dağılım grafiğindeki nitelikler hakkında hangi gözlemleri yapabileceğimi …

1
Birçok sol eğimli dağılımı görselleştirme
Göstermek istediğim bir dizi sol eğik / ağır kuyruklu dağılımım var. (Etiketli üç faktör arasında 42 dağılımları vardır A, Bve Caşağıda). Ayrıca, varyasyon faktör boyunca daralıyor B. Sahip olduğum sorun, dağılımların sonuç ölçeğinde (oran veya katlama değişikliği) farklılaştırılması zor olmasıdır: Verilerin günlüğe kaydedilmesi, sol çarpıklığı aşırı vurgulamaktadır ve kuyruklara daha …

2
Özet istatistikleri ortalama, sd, min ve max ile mi çiziyorsunuz?
Ben bir ekonomi geçmişindeyim ve genellikle disiplinde değişkenlerin özet istatistikleri bir tabloda rapor edilir. Ancak, onları planlamak istiyorum. Bir kutu grafiğini ortalama, standart sapma, minimum ve maksimum değerlerini görüntüleyecek şekilde değiştirebilirim, ancak kutu grafikleri geleneksel olarak medyanları ve Q1 ve Q3'ü görüntülemek için kullanıldığından bunu yapmak istemiyorum. Tüm değişkenlerimin farklı …

2
Birçok değişken için dağılım grafiği matrisini keşfetme
Birçok parametreli bir veri kümesini analiz ediyorum (örneğin, 50-200) ve değişkenler arasındaki ilişkilere bakmakla ilgileniyorum (örneğin, 2 değişkenli dağılım grafikleri veya 2d histogramları açısından). Bununla birlikte, bu sayıda parametre için 200x200'lik bir dizi grafik çizmek mümkün görünmemektedir (yazdırıp bir duvara asmadıkça). Öte yandan, sadece bir korelasyon matrisi yapmak 2 değişkenli …

3
Lojistik regresyon için Bayesli uyum iyiliği nasıl görselleştirilir
Bayes lojistik regresyon problemi için posterior bir prediktif dağılım oluşturdum. Tahmin dağılımından örnek alıyorum ve sahip olduğum her gözlem için binlerce (0,1) örnek alıyorum. Uyumun iyiliğini görselleştirmek ilginç olmaktan daha azdır, örneğin: Bu grafik, 10.000 örneği + gözlenen referans noktasını gösterir (soldaki yol kırmızı bir çizgi oluşturabilir: evet bu gözlemdir). …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.