@Ondrej ve @Michelle burada bazı iyi bilgiler verdiler. Başka bir yerde bahsedilmeyen bazı konuları ele alarak katkıda bulunup bulunamayacağımı merak ediyorum. Tablodaki verilerden çok fazla bilgi elde edememek konusunda kendinizi yenmezdim, tablolar genellikle bilgi sunmak için çok iyi bir yol değildir ( çapraz başvuru , Gelman ve diğerleri, Tabloları Grafiklere Dönüştürmek ). Öte yandan, yeni bir veri kümesini keşfetmenize yardımcı olacak doğru grafikleri otomatik olarak oluşturacak bir araç istemek, sizin için düşünmenizi yapacak bir araç istemek gibidir. (Bunu yanlış anlamayın, sorunuzun o kadar ileri gitmediğinizi açıkça gösterdiğini biliyorum; sadece böyle bir aracın asla olmayacağını kastediyorum.) Bununla ilgili güzel bir tartışma bulunabilir burada .
Bu şeyler söylendi, verilerinizi keşfetmek için kullanmak isteyebileceğiniz grafik türleri hakkında biraz konuşmak istedim. Soruda listelenen parseller iyi bir başlangıç olabilir, ancak bunu biraz optimize edebiliriz. Başlangıç olarak, değişken çiftleriyle ilişkili "çok sayıda çizim" yapmak ideal olmayabilir. Dağılım grafiği yalnızca iki değişken arasındaki marjinal ilişkiyi görüntüler . Önemli ilişkiler genellikle birden çok değişkenin bazı kombinasyonlarında gizlenebilir. Yani bu yaklaşımı güçlendirmenin ilk yolu dağılım grafiği matrisi yapmaktıreşzamanlı olarak tüm çift dağılım grafiklerini görüntüler. Dağılım grafiği matrisleri çeşitli şekillerde geliştirilebilir: Örneğin, her değişkenin dağılımının tek değişkenli çekirdek yoğunluk grafikleri ile birleştirilebilir, farklı grupları çizmek için farklı işaretler / renkler kullanılabilir ve olası doğrusal olmayan ilişkiler, yetersiz bir uyumun üst üste bindirilmesiyle değerlendirilebilir. scatterplot.matrix
Ar araç paketinde işlevi (örnek sayfa Yukarıda bağlantılı yarıya kadar görülebilir) güzel tüm bunları yapabilir.
Bununla birlikte, dağılım grafiği matrisleri iyi bir başlangıç olsa da, yine de sadece marjinal izdüşümleri göstermektedirler. Bunun ötesine geçmeye çalışmanın birkaç yolu vardır. Birincisi, R'deki rgl paketini kullanarak 3 boyutlu grafikleri araştırmaktır . Diğer bir yaklaşım koşullu grafikleri kullanmaktır; koplotlar aynı anda 3 veya 4 değişken arasındaki ilişkilerde yardımcı olabilir. Özellikle kullanışlı bir yaklaşım, dağılım grafiği matrisini etkileşimli olarak kullanmaktır(yine de, bu öğrenmek için daha fazla çaba gerektirir), örneğin 'fırçalama'. Fırçalama, bir matrisin bir karesindeki bir noktayı veya noktaları vurgulamanızı sağlar ve bu noktalar diğer tüm karelerde aynı anda vurgulanır. Fırçayı hareket ettirerek, tüm değişkenlerin birlikte nasıl değiştiğini görebilirsiniz. GÜNCELLEME: Bahsetmeyi unuttuğum bir diğer olasılık, paralel koordinat grafiği kullanmaktır . Bu, yanıt değişkeninizi ayırt etmemede bir dezavantaja sahiptir, ancak örneğin X değişkenleriniz arasındaki korelasyonları incelemede yararlı olabilir.
Ayrıca, verilerinizi toplanma tarihine göre sıralanmış olarak incelediğiniz için de teşekkür etmek istiyorum. Veriler her zaman zamanla toplansa da, insanlar bunu her zaman yapmazlar. Bir çizgi grafiği çizmek güzeldir, ancak bunu otokorelasyon ve kısmi otokorelasyon grafikleriyle tamamlamanızı öneririm . R de, bunların işlevleri sırasıyla acf
ve pacf
.
Tüm bunların sizin için otomatik olarak tüm arazileri yapacak bir araç verme anlamında sorunuza tam olarak cevap vermediğini biliyorum, ancak bir sonuç, aslında korktuğunuz kadar çok parsel yapmak zorunda kalmayacağınızdır. örneğin, bir dağılım grafiği matrisi yalnızca bir kod satırıdır. Buna ek olarak, R'de, kendiniz için bunun bir kısmını otomatikleştirecek bir işlev / bazı yeniden kullanılabilir kod yazmak mümkün olmalıdır (örneğin, değişkenler listesini ve tarih sırasını alan bir işlevi hayal edebiliyorum, sıralar , her biri için çizgi, acf ve pacf grafikleri içeren yeni bir pencere açılır).