«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

6
python pandalarında bir sütunun dtype'ı nasıl kontrol edilir
Sayısal sütunları ve dize sütunlarını işlemek için farklı işlevler kullanmam gerekiyor. Şu an yaptığım şey gerçekten aptalca: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:, (agg.dtypes!=np.float64)&(agg.dtypes!=np.int)]).columns) for y in allc: treat_str(agg[y]) Bunu yapmanın daha zarif bir yolu var mı? Örneğin for y in agg.columns: if(dtype(agg[y]) == …
135 python  pandas 

14
Groupby nesnesi nasıl yazdırılır
Pandalar ile gruplamanın sonucunu yazdırmak istiyorum. Bir veri çerçevem ​​var: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 'A' ile gruplandırdıktan sonra …
134 python  pandas 

10
Pandalar, veri çerçevesini demetler dizisine dönüştürür
Bazı verileri pandaları kullanarak değiştirdim ve şimdi veritabanına geri toplu kaydetme yapmak istiyorum. Bu, veri çerçevesini veri çerçevesinin bir "satırına" karşılık gelen her bir demet ile bir demet dizisine dönüştürmemi gerektiriyor. DataFrame'im şuna benzer: In [182]: data_set Out[182]: index data_date data_1 data_2 0 14303 2012-02-17 24.75 25.03 1 12009 2012-02-16 …
133 python  pandas 

4
Python pandaları: bir veri çerçevesi satırını satır satır doldurun
Bir pandas.DataFramenesneye bir satır eklemenin basit görevini başarmak zor görünüyor. Bununla ilgili, hiçbiri işe yarayan bir yanıt vermeyen 3 yığın aşımı sorusu vardır. İşte yapmaya çalıştığım şey. Satırların ve sütunların adlarının yanı sıra şeklini de zaten bildiğim bir DataFrame'im var. >>> df = pandas.DataFrame(columns=['a','b','c','d'], index=['x','y','z']) >>> df a b c …
133 python  dataframe  row  pandas 

20
Python'da bir sıcak kodlamayı nasıl yapabilirim?
% 80 kategorik değişkenli bir makine öğrenimi sınıflandırma sorunum var. Sınıflandırma için bir sınıflandırıcı kullanmak istiyorsam tek bir dinamik kodlama kullanmalı mıyım? Verileri kodlama olmadan bir sınıflandırıcıya aktarabilir miyim? Özellik seçimi için aşağıdakileri yapmaya çalışıyorum: Tren dosyasını okudum: num_rows_to_read = 10000 train_small = pd.read_csv("../../dataset/train.csv", nrows=num_rows_to_read) Kategorik özelliklerin türünü 'kategori' olarak …

5
Pandas DataFrame: bir sütundaki tüm değerleri duruma göre değiştirin
Aşağıdaki gibi basit bir DataFrame'im var: 'İlk Sezon' sütunundaki tüm değerleri seçmek ve 1990'dan büyük olanları 1 ile değiştirmek istiyorum. Bu örnekte, yalnızca Baltimore Kuzgunları 1996'yı 1 ile değiştirecektir (verilerin geri kalanını olduğu gibi koruyarak). Aşağıdakileri kullandım: df.loc[(df['First Season'] > 1990)] = 1 Ancak, yalnızca 'İlk Sezon' sütunundaki değerleri değil, …
132 python  pandas  dataframe 

5
Pandalarda verileri normalleştirin
Pandalar veri çerçevem ​​olduğunu varsayalım df: Bir veri çerçevesinin sütun bazında ortalamasını hesaplamak istiyorum. Bu kolay: df.apply(average) daha sonra sütun bilge aralığı max (col) - min (col). Bu yine çok kolay: df.apply(max) - df.apply(min) Şimdi her eleman için sütununun ortalamasını çıkarmak ve sütununun aralığına bölmek istiyorum. Bunu nasıl yapacağımdan emin …
131 python  pandas  numpy 

3
Pandalarda meydana gelen olayları saymanın en etkili yolu nedir?
Aşağıdakileri içeren büyük (yaklaşık 12 milyon satır) bir veri çerçevem ​​df var: df.columns = ['word','documents','frequency'] Dolayısıyla aşağıdakiler zamanında gerçekleşti: word_grouping = df[['word','frequency']].groupby('word') MaxFrequency_perWord = word_grouping[['frequency']].max().reset_index() MaxFrequency_perWord.columns = ['word','MaxFrequency'] Ancak, bunun çalışması beklenmedik uzun bir zaman alıyor: Occurrences_of_Words = word_grouping[['word']].count().reset_index() Burada neyi yanlış yapıyorum? Büyük bir veri çerçevesinde oluşumları saymanın daha …
131 python  pandas 

2
değişkenin veri çerçevesi olup olmadığını kontrol edin
f fonksiyonum bir değişkenle çağrıldığında, var'ın bir pandas veri çerçevesi olup olmadığını kontrol etmek istiyorum: def f(var): if var == pd.DataFrame(): print "do stuff" Sanırım çözüm oldukça basit olabilir, ancak def f(var): if var.values != None: print "do stuff" Beklendiği gibi çalışmasını sağlayamıyorum.
131 python  pandas 

13
Pandas veri çerçevesinde tüm sütunların adı nasıl gösterilir?
Yüzlerce sütundan oluşan bir veri çerçevem ​​var ve tüm sütun adlarını görmem gerekiyor. Ben ne yaptım: In[37]: data_all2.columns Çıktı: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) Kesilmiş bir liste yerine tüm sütunları nasıl …
131 python  pandas  dataframe  show 


8
Ayrı Pandas DataFrame'lerini alt çizimler olarak nasıl çizebilirim?
Aynı değer ölçeğini paylaşan, ancak farklı sütunlara ve indekslere sahip birkaç Pandas DataFrame'im var. Çağırırken df.plot(), ayrı arsa görüntüleri alıyorum. Gerçekten istediğim şey, hepsinin alt konularla aynı arsada olması, ancak ne yazık ki bir yardımın nasıl ve ne kadar çok takdir edileceğine dair bir çözüm bulamıyorum.

4
Pandalar veri çerçevesi listesini birlikte birleştirin
Tek bir Pandas veri çerçevesinde birleştirmek istediğim Pandas veri çerçevesi listesi var. Python 2.7.10 ve Pandas 0.16.2 kullanıyorum Veri çerçevesi listesini şuradan oluşturdum: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , cnxn, chunksize=10000): dfs.append(chunk) Bu, bir veri çerçevesi listesi döndürür …

3
Pandas GroupBy.agg () kullanılarak aynı sütunun birden çok toplamı
Birden çok kez çağrı yapmak zorunda kalmadan f1, f2aynı sütuna iki farklı toplama işlevini uygulamanın yerleşik bir yolu var mı?df["returns"]agg() Örnek veri çerçevesi: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), …

10
Python'da pandaları kullanan tüm yinelenen öğelerin bir listesini nasıl alabilirim?
Bazı ihracat sorunları olması muhtemel öğelerin bir listesi var. El ile karşılaştırabilmek için yinelenen öğelerin bir listesini almak istiyorum. Pandaların çoğaltılmış yöntemini kullanmaya çalıştığımda , yalnızca ilk kopyayı döndürüyor. Yalnızca ilkini değil de tüm kopyaları almanın bir yolu var mı? Veri kümemin küçük bir alt bölümü şuna benzer: ID,ENROLLMENT_DATE,TRAINER_MANAGING,TRAINER_OPERATOR,FIRST_VISIT_DATE 1536D,12-Feb-12,"06DA1B3-Lebanon …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.