«dplyr» etiketlenmiş sorular

Dplyr paketindeki group_by, özetleme, filtreleme ve seçme gibi işlevlerle ilgili sorular için bu etiketi kullanın.

5
Birden çok sütun kümesi toplayın
Yanıtlayanların 1-3 kez soru döngüsünden geçtiği çevrimiçi bir anketten verilerim var. Anket yazılımı (Qualtrics) birden çok sütun-olduğu bu verileri kaydeder, ankete Q3.2 sütunlar bulunur Q3.2.1., Q3.2.2.ve Q3.2.3.: df <- data.frame( id = 1:10, time = as.Date('2009-01-01') + 0:9, Q3.2.1. = rnorm(10, 0, 1), Q3.2.2. = rnorm(10, 0, 1), Q3.2.3. = …
108 r  reshape  dplyr  qualtrics  tidyr 

6
dplyr kullanarak data.frame'deki tam vakalar için filtre (vaka bazında silme)
Dplyr kullanarak tam vakalar için bir data.frame'i filtrelemek mümkün müdür? complete.caseselbette tüm değişkenlerin bir listesi ile çalışır. Ancak bu a) çok sayıda değişken olduğunda ayrıntılıdır ve b) değişken adları bilinmediğinde (örneğin herhangi bir data.frame'i işleyen bir işlevde) imkansızdır. library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df …
101 r  dplyr  magrittr 

4
dplyr özetle: Çıktıda sıfır uzunlukta grupları tutmak için ".drop = FALSE" eşdeğeri
Kullanırken summariseile plyrbireyin ddplyfonksiyonu, boş kategorileri varsayılan olarak bırakılır. Bu davranışı ekleyerek değiştirebilirsiniz .drop = FALSE. Ancak bu, summariseile kullanıldığında çalışmaz dplyr. Sonuçta boş kategorileri tutmanın başka bir yolu var mı? İşte sahte verilerle bir örnek. library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(1:2,6)) # Now add an extra level to df$b that …
98 r  dplyr  plyr  tidyr 

6
Dplyr ile birden çok sütun boyunca toplama
Sorum, bir veri çerçevesinin birden çok sütunundaki değerleri toplamayı ve kullanarak bu toplama karşılık gelen yeni bir sütun oluşturmayı içerir dplyr. Sütunlardaki veri girişleri ikilidir (0,1). summarise_eachVeya mutate_eachişlevinin satır bazında bir analoğunu düşünüyorum dplyr. Aşağıda, veri çerçevesinin minimal bir örneği verilmiştir: library(dplyr) df=data.frame( x1=c(1,0,0,NA,0,1,1,NA,0,1), x2=c(1,1,NA,1,1,0,NA,NA,0,1), x3=c(0,1,0,1,1,0,NA,NA,0,1), x4=c(1,0,NA,1,0,0,NA,0,0,1), x5=c(1,1,NA,1,1,1,NA,1,0,1)) > df …
98 r  dplyr 

8
R dplyr: Birden çok sütunu bırak
Bir veri çerçevem ​​ve bu veri çerçevesindeki bırakmak istediğim sütunların listesi var. irisVeri kümesini örnek olarak kullanalım . Ben kapatmak istiyorum Sepal.Lengthve Sepal.Widthsadece kalan sütunları kullanın. Nasıl kullanarak bunu yapıyorsunuz selectya select_gelen dplyrpaketin? Şimdiye kadar denediklerim şunlar: drop.cols <- c('Sepal.Length', 'Sepal.Width') iris %>% select(-drop.cols) -Drop.cols'de hata: tekli operatör için geçersiz …
97 r  dplyr 

6
dplyr: "n () 'de hata: işlev doğrudan çağrılmamalıdır”
Dplyr paketindeki örneklerden birini yeniden oluşturmaya çalışıyorum ama bu hata mesajını alıyorum. Her kombinasyonun sıklığıyla üretilen yeni bir sütun n görmeyi bekliyorum. Neyi kaçırıyorum? Paketin yüklendiğini üç kez kontrol ettim. library(dplyr) # summarise peels off a single layer of grouping by_vs_am <- group_by(mtcars, vs, am) by_vs <- summarise(by_vs_am, n = …

1
"Summarize ()" çıktıyı "x" ile yeniden gruplayarak (".groups" argümanını geçersiz kılın) dplyr mesajı nasıl yorumlanır?
Group_by çalıştırırken yeni bir mesaj almaya başladım (gönderi başlığına bakın) ve dplyr geliştirme sürümü 0.8.99.9003'e güncelledikten sonra özet (). Çıktıyı yeniden oluşturmak için bir örnek: library(tidyverse) library(hablar) df <- read_csv("year, week, rat_house_females, rat_house_males, mouse_wild_females, mouse_wild_males 2018,10,1,1,1,1 2018,10,1,1,1,1 2018,11,2,2,2,2 2018,11,2,2,2,2 2019,10,3,3,3,3 2019,10,3,3,3,3 2019,11,4,4,4,4 2019,11,4,4,4,4") %>% convert(chr(year,week)) %>% mutate(total_rodents = rowSums(select_if(., is.numeric))) …
94 r  dplyr  summarize 

5
R Boru operatörünü kullanırken koşullu değerlendirme%>%
Boru operatörünü kullanırken %>%gibi paketleri ile dplyr, ggvis, dycharts, vb nasıl yaparım koşullu bir adım mı? Örneğin; step_1 %>% step_2 %>% if(condition) step_3 Bu yaklaşımlar işe yaramıyor gibi görünüyor: step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2 %>% if(condition) step_3 Uzun bir yol var: if(condition) { step_1 %>% step_2 …
94 r  dplyr  ggvis  magrittr 

6
Gruba göre en yüksek değerleri elde etmek
İşte örnek bir veri çerçevesi: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Her bir değeri için dilk 5 değerine sahip satırları içeren alt kümeyi istiyorum .xgrp Base-R'yi kullanarak yaklaşımım şöyle bir şey olurdu: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) heads <- …
93 r  data.table  dplyr 

4
dplyr on data.table, gerçekten data.table kullanıyorum?
Ben kullanırsanız dplyr bir üstündeki sözdizimi datatable hala dplyr sözdizimini kullanırken, ben Datatable tüm hızı faydaları alabilirim? Başka bir deyişle, datatable'ı dplyr sözdizimi ile sorgularsam yanlış kullanır mıyım? Yoksa tüm gücünden yararlanmak için saf verilebilir sözdizimi kullanmam gerekiyor mu? Herhangi bir tavsiye için şimdiden teşekkürler. Kod Örneği: library(data.table) library(dplyr) diamondsDT …
91 r  data.table  dplyr 

2
Dplyr'e katılırken x ve y sütunlarının adları nasıl belirtilir?
Dplyr kullanarak birleştirmek istediğim iki veri çerçevem ​​var. Biri, ilk isimleri içeren bir veri çerçevesidir. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) Diğer veri çerçevesi, cinsiyeti tanımlayan Kantrowitz isimleri külliyatının temizlenmiş bir versiyonunu içerir. İşte minimal bir örnek: kantrowitz <- structure(list(name = c("john", "bill", "madison", …
91 r  join  left-join  dplyr 

3
koşullu değerlerle dplyr mutasyonu
Dört sütunlu büyük bir veri çerçevesinde ("dosyam"), ilk dört sütunu temel alan değerleri koşullu olarak içeren beşinci bir sütun eklemem gerekiyor. Büyük veri kümelerindeki hızı nedeniyle dplyrve ile yanıtları tercih edin mutate. Veri çerçevem ​​şöyle görünüyor: V1 V2 V3 V4 1 1 2 3 5 2 2 4 4 1 …
88 r  dplyr  mutate 

12
dplyr, satırların bir alt kümesindeki birkaç sütunu değiştirir / değiştirir
Dplyr tabanlı bir iş akışını deneme sürecindeyim (alışkın olduğum çoğunlukla data.table kullanmak yerine) ve eşdeğer bir dplyr çözümü bulamadığım bir sorunla karşılaştım . Genellikle, tek bir koşula bağlı olarak birkaç sütunu koşullu olarak güncellemem / değiştirmem gereken senaryo ile karşılaşıyorum. İşte data.table çözümümle birlikte bazı örnek kod: library(data.table) # Create …
86 r  data.table  dplyr 

7
NA değer kümesiyle nasıl değiştirilir?
Aşağıdaki veri çerçevesi var: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Şöyle görünüyor: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 b 5 3 …
18 r  dplyr  tibble 


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.