Üç sütundan oluşan bir ascii veri kümem var, ancak yalnızca son ikisi gerçek verilerdir. Şimdi kullanarak bir nokta grafiği oluşturmak istiyorum read.csv(file = "result1", sep= " ")
. R üç sütunu da okur. Bundan nasıl kaçınırım?
Üç sütundan oluşan bir ascii veri kümem var, ancak yalnızca son ikisi gerçek verilerdir. Şimdi kullanarak bir nokta grafiği oluşturmak istiyorum read.csv(file = "result1", sep= " ")
. R üç sütunu da okur. Bundan nasıl kaçınırım?
Yanıtlar:
İstediğiniz sütunları seçmek için colClasses
bağımsız değişkeni kullanabilirsiniz read.csv
. Bu durumda, ayarlayabilirsiniz colClasses
içinc("NULL", NA, NA)
read.csv(file="result1", sep=" ", colClasses=c("NULL", NA, NA))
Daha genel olarak, belirli sütun türlerini belirtmek için colClasses'u kullanabilirsiniz; NA
sütunun otomatik olarak ne olduğunu bulmaya çalışmak olan varsayılan yaklaşımı kullanmak anlamına gelir. Daha read.csv
fazla bilgi için yardım sayfasına bakın.
Başka bir seçenek dosyanın tamamını okumaktır, ancak sütunlardan yalnızca ikisini saklamaktır, örneğin:
read.csv(file = "result1", sep = " ")[ ,1:2]
veya sütun adlarını kullanarak, ör. sütunlara 'col1, col2, col3' adı verilmişse
read.csv(file = "result1", sep = " ")[ ,c('col1', 'col2')]
Bu, verilen cevaplara kıyasla daha az zaman alıyor
library(data.table)
fread(file="result1", sep=" ", colClasses=c("NULL", NA, NA))