Programlama dplyr

5

Yanıtlayanların 1-3 kez soru döngüsünden geçtiği çevrimiçi bir anketten verilerim var. Anket yazılımı (Qualtrics) birden çok sütun-olduğu bu verileri kaydeder, ankete Q3.2 sütunlar bulunur Q3.2.1., Q3.2.2.ve Q3.2.3.: df <- data.frame( id = 1:10, time = as.Date('2009-01-01') + 0:9, Q3.2.1. = rnorm(10, 0, 1), Q3.2.2. = rnorm(10, 0, 1), Q3.2.3. = …

108 r reshape dplyr qualtrics tidyr

6

dplyr kullanarak data.frame'deki tam vakalar için filtre (vaka bazında silme)

Dplyr kullanarak tam vakalar için bir data.frame'i filtrelemek mümkün müdür? complete.caseselbette tüm değişkenlerin bir listesi ile çalışır. Ancak bu a) çok sayıda değişken olduğunda ayrıntılıdır ve b) değişken adları bilinmediğinde (örneğin herhangi bir data.frame'i işleyen bir işlevde) imkansızdır. library(dplyr) df = data.frame( x1 = c(1,2,3,NA), x2 = c(1,2,NA,5) ) df …

101 r dplyr magrittr

4

dplyr özetle: Çıktıda sıfır uzunlukta grupları tutmak için ".drop = FALSE" eşdeğeri

Kullanırken summariseile plyrbireyin ddplyfonksiyonu, boş kategorileri varsayılan olarak bırakılır. Bu davranışı ekleyerek değiştirebilirsiniz .drop = FALSE. Ancak bu, summariseile kullanıldığında çalışmaz dplyr. Sonuçta boş kategorileri tutmanın başka bir yolu var mı? İşte sahte verilerle bir örnek. library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(1:2,6)) # Now add an extra level to df$b that …

98 r dplyr plyr tidyr

6

Dplyr ile birden çok sütun boyunca toplama

Sorum, bir veri çerçevesinin birden çok sütunundaki değerleri toplamayı ve kullanarak bu toplama karşılık gelen yeni bir sütun oluşturmayı içerir dplyr. Sütunlardaki veri girişleri ikilidir (0,1). summarise_eachVeya mutate_eachişlevinin satır bazında bir analoğunu düşünüyorum dplyr. Aşağıda, veri çerçevesinin minimal bir örneği verilmiştir: library(dplyr) df=data.frame( x1=c(1,0,0,NA,0,1,1,NA,0,1), x2=c(1,1,NA,1,1,0,NA,NA,0,1), x3=c(0,1,0,1,1,0,NA,NA,0,1), x4=c(1,0,NA,1,0,0,NA,0,0,1), x5=c(1,1,NA,1,1,1,NA,1,0,1)) > df …

98 r dplyr

8

R dplyr: Birden çok sütunu bırak

Bir veri çerçevem ve bu veri çerçevesindeki bırakmak istediğim sütunların listesi var. irisVeri kümesini örnek olarak kullanalım . Ben kapatmak istiyorum Sepal.Lengthve Sepal.Widthsadece kalan sütunları kullanın. Nasıl kullanarak bunu yapıyorsunuz selectya select_gelen dplyrpaketin? Şimdiye kadar denediklerim şunlar: drop.cols <- c('Sepal.Length', 'Sepal.Width') iris %>% select(-drop.cols) -Drop.cols'de hata: tekli operatör için geçersiz …

97 r dplyr

6

dplyr: "n () 'de hata: işlev doğrudan çağrılmamalıdır”

Dplyr paketindeki örneklerden birini yeniden oluşturmaya çalışıyorum ama bu hata mesajını alıyorum. Her kombinasyonun sıklığıyla üretilen yeni bir sütun n görmeyi bekliyorum. Neyi kaçırıyorum? Paketin yüklendiğini üç kez kontrol ettim. library(dplyr) # summarise peels off a single layer of grouping by_vs_am <- group_by(mtcars, vs, am) by_vs <- summarise(by_vs_am, n = …

96 r function plyr dplyr conflicting-libraries

1

"Summarize ()" çıktıyı "x" ile yeniden gruplayarak (".groups" argümanını geçersiz kılın) dplyr mesajı nasıl yorumlanır?

Group_by çalıştırırken yeni bir mesaj almaya başladım (gönderi başlığına bakın) ve dplyr geliştirme sürümü 0.8.99.9003'e güncelledikten sonra özet (). Çıktıyı yeniden oluşturmak için bir örnek: library(tidyverse) library(hablar) df <- read_csv("year, week, rat_house_females, rat_house_males, mouse_wild_females, mouse_wild_males 2018,10,1,1,1,1 2018,10,1,1,1,1 2018,11,2,2,2,2 2018,11,2,2,2,2 2019,10,3,3,3,3 2019,10,3,3,3,3 2019,11,4,4,4,4 2019,11,4,4,4,4") %>% convert(chr(year,week)) %>% mutate(total_rodents = rowSums(select_if(., is.numeric))) …

94 r dplyr summarize

5

R Boru operatörünü kullanırken koşullu değerlendirme%>%

Boru operatörünü kullanırken %>%gibi paketleri ile dplyr, ggvis, dycharts, vb nasıl yaparım koşullu bir adım mı? Örneğin; step_1 %>% step_2 %>% if(condition) step_3 Bu yaklaşımlar işe yaramıyor gibi görünüyor: step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2 %>% if(condition) step_3 Uzun bir yol var: if(condition) { step_1 %>% step_2 …

94 r dplyr ggvis magrittr

6

Gruba göre en yüksek değerleri elde etmek

İşte örnek bir veri çerçevesi: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Her bir değeri için dilk 5 değerine sahip satırları içeren alt kümeyi istiyorum .xgrp Base-R'yi kullanarak yaklaşımım şöyle bir şey olurdu: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) heads <- …

93 r data.table dplyr

4

dplyr on data.table, gerçekten data.table kullanıyorum?

Ben kullanırsanız dplyr bir üstündeki sözdizimi datatable hala dplyr sözdizimini kullanırken, ben Datatable tüm hızı faydaları alabilirim? Başka bir deyişle, datatable'ı dplyr sözdizimi ile sorgularsam yanlış kullanır mıyım? Yoksa tüm gücünden yararlanmak için saf verilebilir sözdizimi kullanmam gerekiyor mu? Herhangi bir tavsiye için şimdiden teşekkürler. Kod Örneği: library(data.table) library(dplyr) diamondsDT …

91 r data.table dplyr

2

Dplyr'e katılırken x ve y sütunlarının adları nasıl belirtilir?

Dplyr kullanarak birleştirmek istediğim iki veri çerçevem var. Biri, ilk isimleri içeren bir veri çerçevesidir. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) Diğer veri çerçevesi, cinsiyeti tanımlayan Kantrowitz isimleri külliyatının temizlenmiş bir versiyonunu içerir. İşte minimal bir örnek: kantrowitz <- structure(list(name = c("john", "bill", "madison", …

91 r join left-join dplyr

3

koşullu değerlerle dplyr mutasyonu

Dört sütunlu büyük bir veri çerçevesinde ("dosyam"), ilk dört sütunu temel alan değerleri koşullu olarak içeren beşinci bir sütun eklemem gerekiyor. Büyük veri kümelerindeki hızı nedeniyle dplyrve ile yanıtları tercih edin mutate. Veri çerçevem şöyle görünüyor: V1 V2 V3 V4 1 1 2 3 5 2 2 4 4 1 …

88 r dplyr mutate

12

dplyr, satırların bir alt kümesindeki birkaç sütunu değiştirir / değiştirir

Dplyr tabanlı bir iş akışını deneme sürecindeyim (alışkın olduğum çoğunlukla data.table kullanmak yerine) ve eşdeğer bir dplyr çözümü bulamadığım bir sorunla karşılaştım . Genellikle, tek bir koşula bağlı olarak birkaç sütunu koşullu olarak güncellemem / değiştirmem gereken senaryo ile karşılaşıyorum. İşte data.table çözümümle birlikte bazı örnek kod: library(data.table) # Create …

86 r data.table dplyr

7

NA değer kümesiyle nasıl değiştirilir?

Aşağıdaki veri çerçevesi var: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Şöyle görünüyor: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 b 5 3 …

18 r dplyr tibble

3

Mutasyonun sağ tarafında recodeta düzenli tabanlı standart dışı değerlendirmenin kullanılması

Her sütunun birçok değer alabilen bir karakter vektörü olduğu bir tibble düşünün - diyelim ki "A" - "F". library(tidyverse) sample_df <- tibble(q1 = c("A", "B", "C"), q2 = c("B", "B", "A")) Bağımsız değişken olarak bir sütun adı alır ve bu sütunu yeniden kodlar, böylece herhangi bir yanıt "A" bir NA …

13 r dplyr rlang tidyeval nse

«dplyr» etiketlenmiş sorular