Burada karakter vektörlerinin datetime sınıflarına nasıl dönüştürüleceğini soran bir dizi soruyu takip ettim. Sıklıkla 2 yöntem görüyorum, strptime ve as.POSIXct / as.POSIXlt yöntemleri. 2 fonksiyona baktım ama farkın ne olduğu belirsiz.
strptime
function (x, format, tz = "")
{
y <- .Internal(strptime(as.character(x), format, tz))
names(y$year) <- names(x)
y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>
as.POSIXct
function (x, tz = "", ...)
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>
as.POSIXlt
function (x, tz = "", ...)
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>
Performans farklılıkları olup olmadığını görmek için bir mikro kıyaslama yapmak:
library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)
Unit: milliseconds
expr min lq median uq max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2 strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422
strptime biraz daha hızlı görünüyor. peki ne verir? neden 2 benzer işlev olsun veya aralarında kaçırdığım farklılıklar var mı?
as.POSIXct
veas.POSIXlt
karakter vektörler, bakmak üzerindeas.POSIXct.default
veas.POSIXlt.character
sırasıyla.