«dataframe» etiketlenmiş sorular

Veri çerçevesi tablo şeklinde bir veri yapısıdır. Genellikle, satırların gözlem olduğu ve sütunların çeşitli türlerde değişkenler olduğu veriler içerir. "Veri çerçevesi" veya "veri çerçevesi" bu kavram için birçok dilde kullanılan terim olsa da (R, Apache Spark, deedle, Maple, Python'daki panda kütüphanesi ve Julia'daki DataFrames kütüphanesi), "tablo" MATLAB ve SQL.

11
Veri çerçevesini birden çok veri çerçevesine bölme
Bir deneyden elde edilen verilerle (60 katılımcı) çok büyük bir veri çerçevem ​​var (yaklaşık 1 milyon satır). Veri çerçevesini 60 veri çerçevesine (her katılımcı için bir veri çerçevesi) bölmek istiyorum. Veri çerçevesinde, her katılımcının benzersiz kodu olan databir değişken vardır 'name'. Aşağıdakileri denedim, ancak hiçbir şey olmuyor (veya yürütme bir …


1
Pandas 'Freq' etiketleriyle ilgili belgeler nerede? [kapalı]
Kapalı. Bu soru Yığın Taşması yönergelerini karşılamıyor . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek mi istiyorsunuz? Yığın Taşması için konuya uygun olması için soruyu güncelleyin . 2 yıl önce kapalı . Bu soruyu geliştirin Pandalar konusunda yeniyim ve kullanmaya çalışıyorum date_range. Ben iyi şeyler her türlü rastladı freqgibi …


9
CSV dosyasını bir Pandas DataFrame olarak içe aktarın
Bir CSV dosyasında pandalar DataFrame'e okumanın Python yolu nedir (daha sonra istatistiksel işlemler için kullanabilirim, farklı türde sütunlar olabilir, vb.)? CSV dosyam "value.txt"aşağıdaki içeriğe sahip: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 R'de bu dosyayı kullanarak okurduk: price <- read.csv("value.txt") ve bu bir R data.frame döndürür: > price <- …
91 python  pandas  csv  dataframe 

6
çoklu dizinli pandalardan seçim yapmak
'A' ve 'B' sütunlarına sahip çoklu indeksli bir veri çerçevem ​​var. Dizini tek bir sütun dizinine sıfırlamadan çoklu dizinin bir sütununda filtreleme yaparak satırları seçmenin bir yolu var mı? Örneğin. # has multi-index (A,B) df #can I do this? I know this doesn't work because the index is multi-index so …

5
pandalar veri çerçevesinde demet sütunu nasıl bölünür?
Pandalar veri çerçevem ​​var (bu sadece küçük bir parça) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV \ …

5
Spark DataFrame grubu: Azalan düzende sıralama ve sıralama (pyspark)
Pyspark (Python 2.7.9 / Spark 1.3.1) kullanıyorum ve azalan düzende filtrelemem ve sıralamam gereken bir veri çerçevesi GroupObject sahibiyim. Bu kod parçasıyla bunu başarmaya çalışıyorum. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Ancak şu hatayı atıyor. sort() got an unexpected keyword argument 'ascending'


5
Pandalar DataFrame'i iç içe geçmiş sözlükteki öğelerden oluşturun
Şu yapıyla iç içe geçmiş bir 'user_dict' sözlüğüm olduğunu varsayalım: Seviye 1: Kullanıcı Kimliği (Uzun Tamsayı) Seviye 2: Kategori (Dize) Seviye 3: Çeşitli Nitelikler (yüzer, tam sayılar, vb.) Örneğin, bu sözlüğün bir girişi şöyle olacaktır: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": "another"}} …

13
İki veri çerçevesini karşılaştırma ve farklılıkları elde etme
İki veri çerçevem ​​var. Örnekler: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 Apple 22.1 …



1
DataFrame'deki her hücreye işlev uygulayın
Şuna benzeyen bir veri çerçevem ​​var: A B C foo bar foo bar bar foo foo bar Her satırın her öğesine (veya her sütunun her öğesine) bakmak ve sonraki DF'yi elde etmek için aşağıdaki işlevi uygulamak istiyorum: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar wow bar bar …

3
Sütundaki ortak değere göre büyük bir veri çerçevesini bir veri çerçevesi listesine bölme
"Kullanıcıların" eylemlerini toplayan 10 sütunlu bir veri çerçevem ​​var, burada sütunlardan biri bir kimlik içeriyor (benzersiz değil, kullanıcıyı tanımlayan) (sütun 10). veri çerçevesinin uzunluğu yaklaşık 750000 satırdır. Tek bir aktörün eylemlerini izole etmek için "kullanıcı" tanımlayıcısını içeren sütuna ayrı ayrı veri çerçevelerini çıkarmaya çalışıyorum (bu nedenle veri çerçevelerinin bir listesini …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.