«pandas-groupby» etiketlenmiş sorular

Değişkenleri belirli bir koşula göre gruplamak için kullanılacak. Ve yalnızca "pandalar" kitaplığıyla alakalı olarak kullanılmalıdır


7
Pandalar GroupBy kullanarak her grup için istatistik (sayım, ortalama, vb.) Alın?
Bir veri çerçevesi var dfve ondan birkaç sütun kullanın groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Yukarıdaki şekilde neredeyse ihtiyacım olan tabloyu (veri çerçevesi) alıyorum. Eksik olan, her gruptaki satır sayısını içeren ek bir sütundur. Başka bir deyişle, demek istediğim ama aynı zamanda bu araçları elde etmek için kaç tane sayı kullanıldığını da bilmek istiyorum. …

2
Veri çerçevesi nasıl döndürülür
Pivot nedir? Nasıl dönebilirim? Bu bir pivot mu? Uzun formattan geniş formata? Pivot tablolar hakkında soran birçok soru gördüm. Pivot tablolar hakkında sorular sorduklarını bilmeseler bile, genellikle öyledir. Pivotlamanın tüm yönlerini kapsayan kanonik bir soru ve cevap yazmak neredeyse imkansızdır .... ... Ama bir şans vereceğim. Mevcut sorular ve cevaplar …



5
Panda groupby dataframe'e anahtarla nasıl erişilir
Bir groupby nesnesindeki ilgili groupby veri çerçevesine tuşuyla nasıl erişebilirim? Aşağıdaki groupby ile: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Anahtarları ve grupları almak için tekrarlayabilirim: In [11]: for k, gp in gb: print 'key=' + str(k) print …

9
pandas GroupNaN (eksik) değerlere sahip sütunlar
Ben groupby istediğim sütunlarda birçok eksik değerleri olan bir DataFrame var: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} Pandaların NaN hedef değerleri olan satırları bıraktığını görün. (Bu satırları dahil etmek istiyorum!) …

3
Pandas GroupBy.agg () kullanılarak aynı sütunun birden çok toplamı
Birden çok kez çağrı yapmak zorunda kalmadan f1, f2aynı sütuna iki farklı toplama işlevini uygulamanın yerleşik bir yolu var mı?df["returns"]agg() Örnek veri çerçevesi: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), …

10
GroupBy pandas DataFrame ve en yaygın değeri seçin
Üç dize sütunu olan bir veri çerçevem ​​var. 3. sütundaki tek değerin ilk ikisinin her kombinasyonu için geçerli olduğunu biliyorum. Verileri temizlemek için veri çerçevesine göre ilk iki sütuna göre gruplandırmalı ve her kombinasyon için üçüncü sütunun en yaygın değerini seçmeliyim. Kodum: import pandas as pd from scipy import stats …

4
pandalar veri çerçeve grubu tarih ve aya göre
Bir csv dosyası düşünün: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 2:02pm,3.0 a string,5/2/11 2:56pm,4.0 a string,5/2/11 3:00pm,5.0 a string,5/2/14 3:02pm,6.0 a string,5/2/14 3:18pm,7.0 Bunu içinde okuyabilir ve tarih sütununu datetime biçiminde yeniden biçimlendirebilirim: b=pd.read_csv('b.dat') b['date']=pd.to_datetime(b['date'],format='%m/%d/%y …

4
Pandas groupby kullanarak birkaç satırdaki dizeleri birleştirin
Pandas'ta groupedby'yi temel alan bir veri çerçevesindeki birkaç dizeyi birleştirmek istiyorum. Şimdiye kadarki kodum bu: import pandas as pd from io import StringIO data = StringIO(""" "name1","hej","2014-11-01" "name1","du","2014-11-02" "name1","aj","2014-12-01" "name1","oj","2014-12-02" "name2","fin","2014-11-01" "name2","katt","2014-11-02" "name2","mycket","2014-12-01" "name2","lite","2014-12-01" """) # load string as stream into dataframe df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2]) # add column with …


2
Pandalar groupby (). Sum () çıktısından nasıl yeni bir sütun oluşturabilirim?
groupbyHesaplamadan yeni bir sütun oluşturmaya çalışıyorum . Aşağıdaki kodda, her tarih için doğru hesaplanmış değerleri alıyorum (aşağıdaki gruba bakın) ancak onunla yeni bir sütun ( df['Data4']) oluşturmaya çalıştığımda NaN alıyorum. Bu yüzden, dataframe içinde Data3tüm tarihlerin toplamı ile yeni bir sütun oluşturmaya ve bunu her tarih satırına uygulamaya çalışıyorum. Örneğin, …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.