Üç sütundan oluşan bir ascii veri kümem var, ancak yalnızca son ikisi gerçek verilerdir. Şimdi kullanarak bir nokta grafiği oluşturmak istiyorum read.csv(file = "result1", sep= " "). R üç sütunu da okur. Bundan nasıl kaçınırım?
Üç sütundan oluşan bir ascii veri kümem var, ancak yalnızca son ikisi gerçek verilerdir. Şimdi kullanarak bir nokta grafiği oluşturmak istiyorum read.csv(file = "result1", sep= " "). R üç sütunu da okur. Bundan nasıl kaçınırım?
Yanıtlar:
İstediğiniz sütunları seçmek için colClassesbağımsız değişkeni kullanabilirsiniz read.csv. Bu durumda, ayarlayabilirsiniz colClassesiçinc("NULL", NA, NA)
read.csv(file="result1", sep=" ", colClasses=c("NULL", NA, NA))
Daha genel olarak, belirli sütun türlerini belirtmek için colClasses'u kullanabilirsiniz; NAsütunun otomatik olarak ne olduğunu bulmaya çalışmak olan varsayılan yaklaşımı kullanmak anlamına gelir. Daha read.csvfazla bilgi için yardım sayfasına bakın.
Başka bir seçenek dosyanın tamamını okumaktır, ancak sütunlardan yalnızca ikisini saklamaktır, örneğin:
read.csv(file = "result1", sep = " ")[ ,1:2]
veya sütun adlarını kullanarak, ör. sütunlara 'col1, col2, col3' adı verilmişse
read.csv(file = "result1", sep = " ")[ ,c('col1', 'col2')]
Bu, verilen cevaplara kıyasla daha az zaman alıyor
library(data.table)
fread(file="result1", sep=" ", colClasses=c("NULL", NA, NA))