«dplyr» etiketlenmiş sorular

Dplyr paketindeki group_by, özetleme, filtreleme ve seçme gibi işlevlerle ilgili sorular için bu etiketi kullanın.

3
data.table vs dplyr: Biri iyi yapamaz mı diğeri yapamaz mı yoksa kötü yapar mı?
genel bakış Nispeten aşinayım data.table, çok fazla değil dplyr. Ben SO ortaya çıktı bazı dplyrvinyet ve örnekleri okudum ve şimdiye kadar benim sonuçları şunlardır: data.tableve dplyrçok sayıda (yani> 10-100K) grup ve diğer bazı durumlarda (aşağıda kıyaslamalara bakın) hariç, karşılaştırılabilir dplyr daha erişilebilir sözdizimi var dplyr potansiyel DB etkileşimlerini özetler (veya …
759 r  data.table  dplyr 

5
Bir tibble'ın tüm satırlarını görüntüleme / yazdırma (tbl_df)
tibble(önceden tbl_df), dplyrR'deki veri çerçevesi işleme paketi tarafından oluşturulan bir veri çerçevesinin bir sürümüdür. Veri çerçevesini yanlışlıkla çağırırken uzun tablo çıktılarını önler. Bir veri çerçevesi tibble/ tarafından sarıldıktan sonra tbl_df, tüm veri çerçevesini (veri çerçevesinin tüm satırları ve sütunları) görüntülemek için bir komut var mı? Ben kullanırsanız df[1:100,], ben her …
192 r  dplyr  options  display 

4
Belirli bir dize içeren satırları filtrele
Bir veri çerçevesini kriter olarak dizeyi içeren bu satır kullanarak filtrelemek zorunda RTB. Kullanıyorum dplyr. d.del <- df %>% group_by(TrackingPixel) %>% summarise(MonthDelivery = as.integer(sum(Revenue))) %>% arrange(desc(MonthDelivery)) Ben işlevini kullanabilirsiniz biliyorum filteriçinde dplyrama tam olarak değil bir dize içeriği kontrol edecek şekilde anlatmak için nasıl. Özellikle sütundaki içeriği kontrol etmek istiyorum …
188 r  filter  dplyr 


7
Vektör olarak bir dplyr tbl sütununu çıkarma
Veritabanı arka uçlu bir tbl'den bir vektör olarak bir dplyr tbl sütunu almanın daha özlü bir yolu var mı (yani veri çerçevesi / tablosu doğrudan alt küme olamaz)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, iris) iris2$Species # NULL Bu çok kolay olurdu, yani collect(select(iris2, Species))[, 1] …

8
Birden fazla "bilinmeyen sütun" uyarısını düzeltme
Tüm komut türleri (örneğin, paketlere güncelleştirmeleri yüklemek için str (x)) için "bilinmeyen sütun" kalıcı bir çoklu uyarısı var ve bu hata ayıklama veya düzeltmek nasıl emin değilim. "Bilinmeyen sütun" uyarısı, yeniden adlandırdığım bir tbl_df dosyasındaki bir değişkenle açıkça ilişkilidir, ancak uyarı, tbl_df ile alakasız görünen her türlü komutta görüntülenir (ör. …
171 r  dplyr 

9
"Dplyr" de dinamik değişken adları kullanın
dplyr::mutate()Bir veri çerçevesinde birden çok yeni sütun oluşturmak için kullanmak istiyorum . Sütun adları ve içerikleri dinamik olarak oluşturulmalıdır. İris'den örnek veriler: library(dplyr) iris <- tbl_df(iris) Petal.WidthDeğişkenden yeni sütunlarımı değiştirmek için bir işlev oluşturdum : multipetal <- function(df, n) { varname <- paste("petal", n , sep=".") df <- mutate(df, varname …
168 r  dplyr  r-faq 

9
Dize vektör girdisini kullanarak dplyr'de birden çok sütuna göre gruplama
Plyr anlayışımı dplyr'a aktarmaya çalışıyorum, ancak birden çok sütuna göre nasıl gruplanacağını anlayamıyorum. # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) # get the columns we want to average …
157 r  dplyr  r-faq 

7
Dplyr ile bağıl frekanslar / oranlar
Her bir grup içindeki farklı değerlerin oranını hesaplamak istediğimi varsayalım. Örneğin, kullanarak mtcarsverileri, nasıl hesaplarım göreceli sayısının sıklığını dişlileri tarafından am ile tek seferde (/ otomatik manuel) dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) %>% summarise(n = n()) # am gear n # 0 …
153 r  group-by  dplyr  frequency 

9
Gruplandırılmış verilerden ilk ve son satırı seçme
Soru Kullanma dplyr, nasıl bir açıklamada üst ve gruplandırılmış verilerin alt gözlemler / satırları seçilir? Veri ve Örnek Bir veri çerçevesi verildi df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Her gruptan üst ve alt gözlemleri kullanarak slice, ancak iki ayrı ifade kullanarak alabilirim: firstStop <- df %>% group_by(id) %>% arrange(stopSequence) %>% slice(1) …
137 r  dplyr 

6
Dplyr kullanarak yinelenen satırları kaldırın
Bunun gibi bir data.frame var - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 …
128 r  dplyr 

6
Dplyr kullanarak bir tablonun her satırına bir işlev mi uygulamak?
İle çalışırken, plyrsık sık adplyher satıra uygulamak zorunda olduğum skaler işlevler için kullanmayı yararlı buldum . Örneğin data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 4.7 3.2 …
121 r  plyr  dplyr 


6
Dplyr'de "yeniden adlandır" için değiştirme
Plyr'in yeniden adlandırma işlevini seviyorum rename. Son zamanlarda dplyr kullanmaya başladım ve dplyr'den bir işlevi kullanarak değişkenleri yeniden adlandırmanın kolay bir yolu olup olmadığını merak ediyordum, kullanımı plyr'ler kadar kolay renamemı?
118 r  rename  dplyr 

1
Dplyr birden çok sütun veya bileşik anahtar üzerinde birleşebilir mi?
dplyrV3.0'ın farklı değişkenlere katılmanıza izin verdiğinin farkındayım : left_join(x, y, by = c("a" = "b")eşleşir x.aiçiny.b Bununla birlikte, bir değişken kombinasyonuna katılmak mümkün mü yoksa önceden bir bileşik anahtar eklemem gerekiyor mu? Bunun gibi bir şey: left_join(x, y, by = c("a c" = "b d")[ x.ave x.c] 'nin [ y.bve …
111 r  dplyr 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.