Soruda sunulan kullanım senaryosu için, mantıksal koşulu şununla 1(veya daha da iyisi ile 1L) çarpabilirsiniz :
df1 <- data.frame(yr = 1951:1960)
df1$is.1957 <- 1L * (df1$yr == 1957)
df1$after.1957 <- 1L * (df1$yr >= 1957)
hangi verir:
> df1
yr is.1957 after.1957
1 1951 0 0
2 1952 0 0
3 1953 0 0
4 1954 0 0
5 1955 0 0
6 1956 0 0
7 1957 1 1
8 1958 0 1
9 1959 0 1
10 1960 0 1
Örneğin @ zx8754 ve @Sotos'ta sunulan kullanım durumları için, imo henüz ele alınmamış başka seçenekler de var.
1) Kendi make_dummiesişlevinizi yapın
df2 <- data.frame(id = 1:5, year = c(1991:1994,1992))
make_dummies <- function(v, prefix = '') {
s <- sort(unique(v))
d <- outer(v, s, function(v, s) 1L * (v == s))
colnames(d) <- paste0(prefix, s)
d
}
cbind(df2, make_dummies(df2$year, prefix = 'y'))
hangi verir:
id year y1991 y1992 y1993 y1994
1 1 1991 1 0 0 0
2 2 1992 0 1 0 0
3 3 1993 0 0 1 0
4 4 1994 0 0 0 1
5 5 1992 0 1 0 0
2) dcasther ikisinden de- işlevini kullanınveri tablosu veya yeniden şekillendirme2
dcast(df2, id + year ~ year, fun.aggregate = length)
hangi verir:
id year 1991 1992 1993 1994
1 1 1991 1 0 0 0
2 2 1992 0 1 0 0
3 3 1993 0 0 1 0
4 4 1994 0 0 0 1
5 5 1992 0 1 0 0
Bununla birlikte, kukla değerlerin oluşturulması gereken sütunda yinelenen değerler olduğunda bu işe yaramayacaktır. Belirli bir toplama işlevine ihtiyaç duyulması dcastve sonucunun dcastorijinalle birleştirilmesi gerekmesi durumunda:
df3 <- data.frame(var = c("B", "C", "A", "B", "C"))
f <- function(x) as.integer(length(x) > 0)
merge(df3, dcast(df3, var ~ var, fun.aggregate = f), by = 'var', all.x = TRUE)
(sonucun bysütuna göre sıralandığına dikkat edin ):
var A B C
1 A 1 0 0
2 B 0 1 0
3 B 0 1 0
4 C 0 0 1
5 C 0 0 1
3) spreadişlevini kullanıntidyrile ( mutatedandplyr)
library(dplyr)
library(tidyr)
df2 %>%
mutate(v = 1, yr = year) %>%
spread(yr, v, fill = 0)
hangi verir:
id year 1991 1992 1993 1994
1 1 1991 1 0 0 0
2 2 1992 0 1 0 0
3 3 1993 0 0 1 0
4 4 1994 0 0 0 1
5 5 1992 0 1 0 0