«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

10
Pandas veri çerçevesindeki kategorik verileri dönüştürme
Bu tür verilere sahip bir veri çerçevem ​​var (çok fazla sütun): col1 int64 col2 int64 col3 category col4 category col5 category Sütunlar şuna benzer: Name: col3, dtype: category Categories (8, object): [B, C, E, G, H, N, S, W] Sütunlardaki tüm değerleri tam sayıya şu şekilde dönüştürmek istiyorum: [1, 2, …
107 python  pandas 


5
Pandaların MultiIndex'inin başına bir seviye ekleyin
Bazı gruplamalardan sonra oluşturulmuş bir MultiIndex içeren bir DataFrame'im var: import numpy as np import pandas as p from numpy.random import randn df = p.DataFrame({ 'A' : ['a1', 'a1', 'a2', 'a3'] , 'B' : ['b1', 'b2', 'b3', 'b4'] , 'Vals' : randn(4) }).groupby(['A', 'B']).sum() df Output> Vals Output> A B …
107 python  pandas 

13
Pandalar ile Excel sütun genişliklerini otomatik olarak ayarlamanın bir yolu var mı?
Benden bazı Excel raporları oluşturmam isteniyor. Şu anda verilerim için oldukça yoğun bir şekilde panda kullanıyorum, bu nedenle doğal olarak bu raporları oluşturmak için pandas.ExcelWriter yöntemini kullanmak istiyorum. Ancak sabit sütun genişlikleri bir sorundur. Şimdiye kadar sahip olduğum kod yeterince basit. "Df" adında bir veri çerçevem ​​olduğunu varsayalım: writer = …
107 python  excel  pandas  openpyxl 

3
Pandalar veri çerçevesi sütununu int değil dize olarak içe aktar
Aşağıdaki csv'yi int64 olarak değil dizeler olarak içe aktarmak istiyorum. Pandas read_csv bunu otomatik olarak int64'e dönüştürür, ancak bu sütuna dize olarak ihtiyacım var. ID 00013007854817840016671868 00013007854817840016749251 00013007854817840016754630 00013007854817840016781876 00013007854817840017028824 00013007854817840017963235 00013007854817840018860166 df = read_csv('sample.csv') df.ID >> 0 -9223372036854775808 1 -9223372036854775808 2 -9223372036854775808 3 -9223372036854775808 4 -9223372036854775808 5 -9223372036854775808 6 …

8
Pandalar tarihlerin histogramını çizebilir mi?
Serimi aldım ve dtype = datetime sütununa zorladım datetime64[ns](sadece gün çözünürlüğüne ihtiyacım var ... nasıl değiştirileceğinden emin değilim). import pandas as pd df = pd.read_csv('somefile.csv') column = df['date'] column = pd.to_datetime(column, coerce=True) ama komplo çalışmıyor: ipdb> column.plot(kind='hist') *** TypeError: ufunc add cannot use operands with types dtype('<M8[ns]') and dtype('float64') Sadece …

2
"DataFrame" nesnesinin "sort" özelliği yok
Burada bir sorunla karşılaşıyorum, python paketimde numpy yükledim , ancak hala bu hata 'DataFrame' nesnesinin 'sort' özelliği yok Herkes bana fikir verebilir .. Bu benim kodum: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() final.columns=[final.columns,final.iloc[0]] final = final.iloc[1:].reset_index(drop=True) final.columns.names = (None, None)

5
Konuma göre pandalar sütununu seçme
Ben sadece adlandırılmış pandalar sütunlarına bir tamsayı ile erişmeye çalışıyorum. Kullanarak konuma göre bir satır seçebilirsiniz df.ix[3]. Ancak tam sayıya göre bir sütun nasıl seçilir? Veri çerçevem: df=pandas.DataFrame({'a':np.random.rand(5), 'b':np.random.rand(5)})
106 python  pandas  indexing 


4
Numpy isnan () bir kayan nokta dizisinde başarısız oluyor (pandas veri çerçevesinden geçerli)
Pandas veri çerçevesindeki bir uygulamadan çıkan bir dizi kayan nokta (bazı normal sayılar, bazı nans) var. Bazı nedenlerden ötürü, numpy.isnan bu dizide başarısız oluyor, ancak aşağıda gösterildiği gibi, her eleman bir float, numpy.isnan her eleman üzerinde doğru çalışıyor, değişkenin türü kesinlikle bir numpy dizidir. Neler oluyor?! set([type(x) for x in …
106 python  arrays  numpy  pandas 

2
Python Pandalar ile Binning Sütunu
Sayısal değerlere sahip bir Veri Çerçevesi sütunum var: df['percentage'].head() 46.5 44.2 100.0 42.12 Sütunu bin sayıları olarak görmek istiyorum: bins = [0, 1, 5, 10, 25, 50, 100] Sonuçları bidonları ile nasıl alabilirim value counts? [0, 1] bin amount [1, 5] etc [5, 10] etc ......

6
Pandas DataFrame uygulansın () tüm çekirdekleri kullansın mı?
Ağustos 2017 itibarıyla, Pandas DataFame.apply () maalesef hala tek bir çekirdekle çalışmakla sınırlıdır, bu da çok çekirdekli bir makinenin çalıştırdığınızda işlem süresinin çoğunu boşa harcayacağı anlamına gelir df.apply(myfunc, axis=1). Uygulamayı paralel olarak bir dataframe üzerinde çalıştırmak için tüm çekirdeklerinizi nasıl kullanabilirsiniz?
105 pandas  dask 


6
Pandas read_csv işlevinde yüklenen satırları nasıl filtreleyebilirim?
Pandalar kullanarak CSV'nin hangi satırlarının belleğe yükleneceğini nasıl filtreleyebilirim? Bu, içinde bulunması gereken bir seçenek gibi görünüyor read_csv. Bir şey mi kaçırıyorum? Örnek: Zaman damgası sütununa sahip bir CSV'miz var ve yalnızca belirli bir sabitten daha büyük bir zaman damgasına sahip satırları yüklemek istiyoruz.
105 python  pandas 

7
Ipython not defterinde / Jupyter'de, Pandalar çizmeye çalıştığım grafiği görüntülemiyor
Ipython Notebook'ta panda kullanarak bazı verileri çizmeye çalışıyorum ve bana nesneyi verirken, aslında grafiğin kendisini çizmiyor. Yani şuna benziyor: In [7]: pledge.Amount.plot() Out[7]: <matplotlib.axes.AxesSubplot at 0x9397c6c> Grafik bundan sonra gelmeli, ancak görünmüyor. Matplotlib'i ithal ettim, yani sorun bu değil. İçe aktarmam gereken başka modül var mı?

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.