«dataframe» etiketlenmiş sorular

Veri çerçevesi tablo şeklinde bir veri yapısıdır. Genellikle, satırların gözlem olduğu ve sütunların çeşitli türlerde değişkenler olduğu veriler içerir. "Veri çerçevesi" veya "veri çerçevesi" bu kavram için birçok dilde kullanılan terim olsa da (R, Apache Spark, deedle, Maple, Python'daki panda kütüphanesi ve Julia'daki DataFrames kütüphanesi), "tablo" MATLAB ve SQL.

5
İsimli Karakter Vektörünü data.frame'e dönüştürme
XmlAttrs'den şöyle döndürülen adlandırılmış bir karakter vektörüm var: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Bunu şuna benzeyen bir veri çerçevesine dönüştürmek istiyorum: testDF <- data.frame("db_version"="11.2.0.3.0","elapsed_time"=12.89,"cpu_time"=12.71) head(testDF) db_version elapsed_time cpu_time 1 11.2.0.3.0 12.89 12.71

7
İlk satırı gruba göre seçin
Bunun gibi bir veri çerçevesinden test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ] rownames(test) <- 1:10 > test id string 1 1 A 2 1 F 3 2 B 4 2 G 5 3 C 6 3 H 7 4 D 8 4 I 9 5 E 10 …
87 r  dataframe  sqldf 

3
İki panda Veri Çerçevesini birleştirin (ortak bir sütunda birleştirin)
2 veri çerçevem ​​var: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values name 4503 non-null values neighborhoods 4503 non-null values open 4503 non-null values review_count 4503 non-null values …


6
Seri ve DataFrame nasıl birleştirilir
Buraya bir DataFrameve Seriesdizini nasıl birleştireceğiniz konusunda bilgi almak için geldiyseniz , lütfen bu yanıta bakın . OP'nin asıl amacı, başka bir DataFrame'e sütun olarak seri elemanlarının nasıl atanacağını sormaktı . Bunun cevabını bilmekle ilgileniyorsanız, EdChum tarafından kabul edilen cevaba bakın. Bulabildiğim en iyi şey df = pd.DataFrame({'a':[1, 2], 'b':[3, …

10
Seçili sütunlar için bir tablodaki NA değerleri nasıl değiştirilir
NA değerlerini değiştirmeyle ilgili birçok gönderi var. Aşağıdaki tablo / çerçevedeki NA'ların aşağıdakilerle değiştirilebileceğinin farkındayım: x[is.na(x)]<-0 Ancak, bunu yalnızca belirli sütunlarla sınırlamak istersem ne olur? Size bir örnek göstereyim. İlk olarak, bir veri kümesiyle başlayalım. set.seed(1234) x <- data.frame(a=sample(c(1,2,NA), 10, replace=T), b=sample(c(1,2,NA), 10, replace=T), c=sample(c(1:5,NA), 10, replace=T)) Hangi verir: a …


5
Her değişken için stoktan çıkış ve dönüş değeri sayıları?
19717 kişinin programlama dili seçimini çoktan seçmeli sorularla yanıtlayan bir veri çerçevem ​​var. İlk sütun elbette cevap verenin cinsiyeti iken geri kalanı seçtikleri seçimlerdir. Bu nedenle Python'u seçersem, yanıtım bash yerine Python sütununa kaydedilir ve tersi de geçerlidir. ID Gender Python Bash R JavaScript C++ 0 Male Python nan nan …


3
Pandalardaki iki coğrafi veri çerçevesi ile en yakın mesafeyi alın
İşte ilk geodatframe'im: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) City1 City Country …


7
AttributeError: 'DataFrame' nesnesinin 'ix' özelliği yok
Bir sütun, örneğin df.ix [:, 'col_header'] çekmek için bir pandalar veri çerçevesinin .ix özniteliğini kullanmaya çalıştığınızda yukarıdaki hatayı alıyorum. Senaryo bu sabah itibariyle işe yaradı, ancak bu öğleden sonra yeni bir Linux ortamında yeni bir Panda yüklemesiyle çalıştırdım. Bu hatayı daha önce gören var mı? Burada ve başka yerlerde aradım …

3
[:] Ve iloc [:] ile atamak pandalarda neden farklı sonuçlar veriyor?
ilocPandalarda kullanılan farklı indeksleme yöntemleri ile çok karıştım. Diyelim ki bir 1-d Dataframe'i 2-d Dataframe'e dönüştürmeye çalışıyorum. İlk olarak aşağıdaki 1-D Dataframe var a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T Ve bunu 2 boyutlu bir Dataframe'e dönüştüreceğim 2x4. 2-boyutlu Dataframe'i aşağıdaki gibi hazırlayarak başlıyorum: b_df = pd.DataFrame(columns=range(4),index=range(2)) Daha sonra for-loop'u a_df(1-d) …

3
Yavaş pandalar DataFrame MultiIndex reindex
Bir panda DataFrame formun var: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 2019-12-01 00:51:14+00:00 114430 …

1
Bölüm ve alt bölüm içeren sütundan oluşan veri çerçevesinin nasıl döndürüleceği R
Aşağıda belirtilen bir veri çerçevesi var: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", "RE", "RE", …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.