Programlama dataframe

11

Veri çerçevesini birden çok veri çerçevesine bölme

Bir deneyden elde edilen verilerle (60 katılımcı) çok büyük bir veri çerçevem var (yaklaşık 1 milyon satır). Veri çerçevesini 60 veri çerçevesine (her katılımcı için bir veri çerçevesi) bölmek istiyorum. Veri çerçevesinde, her katılımcının benzersiz kodu olan databir değişken vardır 'name'. Aşağıdakileri denedim, ancak hiçbir şey olmuyor (veya yürütme bir …

92 python split pandas dataframe

3

python pandas veri çerçevesi sütunları dikte anahtarına ve değerine dönüştürülür

Birden çok sütunu olan bir pandalar veri çerçevem var ve iki sütundan bir dikt oluşturmak istiyorum: biri diktenin anahtarları, diğeri diktenin değerleri. Bunu nasıl yapabilirim? Veri çerçevesi: area count co tp DE Lake 10 7 Forest 20 5 FR Lake 30 2 Forest 40 3 Alanı anahtar olarak tanımlamalıyım, diktede …

92 python pandas dataframe dictionary data-conversion

1

Pandas 'Freq' etiketleriyle ilgili belgeler nerede? [kapalı]

Kapalı. Bu soru Yığın Taşması yönergelerini karşılamıyor . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek mi istiyorsunuz? Yığın Taşması için konuya uygun olması için soruyu güncelleyin . 2 yıl önce kapalı . Bu soruyu geliştirin Pandalar konusunda yeniyim ve kullanmaya çalışıyorum date_range. Ben iyi şeyler her türlü rastladı freqgibi …

92 python pandas documentation dataframe frequency

7

Pandas veri çerçevesi sütunundaki birkaç değeri başka bir değerle değiştirme

Aşağıda gösterildiği gibi bir panda veri çerçevesi df'im var: BrandName Specialty A H B I ABC J D K AB L BrandName sütunundaki 'ABC' ve 'AB'yi A ile değiştirmek istiyorum. Biri bu konuda yardımcı olabilir mi?

92 python replace pandas dataframe

9

CSV dosyasını bir Pandas DataFrame olarak içe aktarın

Bir CSV dosyasında pandalar DataFrame'e okumanın Python yolu nedir (daha sonra istatistiksel işlemler için kullanabilirim, farklı türde sütunlar olabilir, vb.)? CSV dosyam "value.txt"aşağıdaki içeriğe sahip: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 R'de bu dosyayı kullanarak okurduk: price <- read.csv("value.txt") ve bu bir R data.frame döndürür: > price <- …

91 python pandas csv dataframe

6

çoklu dizinli pandalardan seçim yapmak

'A' ve 'B' sütunlarına sahip çoklu indeksli bir veri çerçevem var. Dizini tek bir sütun dizinine sıfırlamadan çoklu dizinin bir sütununda filtreleme yaparak satırları seçmenin bir yolu var mı? Örneğin. # has multi-index (A,B) df #can I do this? I know this doesn't work because the index is multi-index so …

91 python pandas dataframe multi-index

5

pandalar veri çerçevesinde demet sütunu nasıl bölünür?

Pandalar veri çerçevem var (bu sadece küçük bir parça) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV \ …

91 python numpy pandas dataframe tuples

5

Spark DataFrame grubu: Azalan düzende sıralama ve sıralama (pyspark)

Pyspark (Python 2.7.9 / Spark 1.3.1) kullanıyorum ve azalan düzende filtrelemem ve sıralamam gereken bir veri çerçevesi GroupObject sahibiyim. Bu kod parçasıyla bunu başarmaya çalışıyorum. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Ancak şu hatayı atıyor. sort() got an unexpected keyword argument 'ascending'

90 python apache-spark dataframe pyspark apache-spark-sql

5

Pandalar veri çerçevesindeki sütun birer birer yukarı kaydırılsın mı?

Pandalar veri çerçevem var. Sütunlarımdan birini 'geciktirmek' istiyorum. Bunun anlamı, örneğin, tüm 'gdp' sütununu birer birer yukarı kaydırmak ve ardından kalan satırların altındaki tüm fazla verileri kaldırarak tüm sütunların yeniden eşit uzunlukta olmasını sağlamaktır. df = y gdp cap 0 1 2 5 1 2 3 9 2 8 7 …

90 python pandas dataframe

5

Pandalar DataFrame'i iç içe geçmiş sözlükteki öğelerden oluşturun

Şu yapıyla iç içe geçmiş bir 'user_dict' sözlüğüm olduğunu varsayalım: Seviye 1: Kullanıcı Kimliği (Uzun Tamsayı) Seviye 2: Kategori (Dize) Seviye 3: Çeşitli Nitelikler (yüzer, tam sayılar, vb.) Örneğin, bu sözlüğün bir girişi şöyle olacaktır: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": "another"}} …

90 python pandas dataframe multi-index

13

İki veri çerçevesini karşılaştırma ve farklılıkları elde etme

İki veri çerçevem var. Örnekler: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 Apple 22.1 …

89 python pandas dataframe

6

Her sütun adına bir sonek (veya önek) nasıl eklenir?

_xHer sütun adına şu şekilde sonek eklemek istiyorum: featuresA = myPandasDataFrame.columns.values + '_x' Bunu nasıl yaparım? Ayrıca ek olarak eklemek istersem x_çözüm nasıl değişirdi?

89 python pandas dataframe

17

Data.frame'deki iki sütun arasına sütun ekleyin (ekleyin)

A, b ve c sütunlarına sahip bir veri çerçevem var. B ve c arasına yeni bir d sütunu eklemek istiyorum. Sonuna cbind kullanarak d ekleyebileceğimi biliyorum ama bunu iki sütun arasına nasıl ekleyebilirim ?

89 r dataframe insert

1

DataFrame'deki her hücreye işlev uygulayın

Şuna benzeyen bir veri çerçevem var: A B C foo bar foo bar bar foo foo bar Her satırın her öğesine (veya her sütunun her öğesine) bakmak ve sonraki DF'yi elde etmek için aşağıdaki işlevi uygulamak istiyorum: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar wow bar bar …

88 python pandas dataframe apply

3

Sütundaki ortak değere göre büyük bir veri çerçevesini bir veri çerçevesi listesine bölme

"Kullanıcıların" eylemlerini toplayan 10 sütunlu bir veri çerçevem var, burada sütunlardan biri bir kimlik içeriyor (benzersiz değil, kullanıcıyı tanımlayan) (sütun 10). veri çerçevesinin uzunluğu yaklaşık 750000 satırdır. Tek bir aktörün eylemlerini izole etmek için "kullanıcı" tanımlayıcısını içeren sütuna ayrı ayrı veri çerçevelerini çıkarmaya çalışıyorum (bu nedenle veri çerçevelerinin bir listesini …

88 r performance matrix split dataframe

«dataframe» etiketlenmiş sorular