«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

13
ValueError: numpy.dtype yanlış boyuta sahip, yeniden derlemeyi deneyin
Pandas ve statsmodels paketini python 2.7'ye yükledim. "Pandaları pd olarak içe aktarmayı" denediğimde bu hata mesajı çıkıyor. Biri yardım edebilir mi? Teşekkürler!!! numpy.dtype has the wrong size, try recompiling Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\analytics\ext\python27\lib\site-packages\statsmodels-0.5.0-py2.7-win32.egg\statsmodels\formula\__init__.py", line 4, in <module> from formulatools import handle_formula_data …

6
pandalar: DataFrame satırlarında karmaşık filtre
Satırları her satırın işlevine göre filtrelemek istiyorum, örneğin def f(row): return sin(row['velocity'])/np.prod(['masses']) > 5 df = pandas.DataFrame(...) filtered = df[apply_to_all_rows(df, f)] Veya başka bir daha karmaşık, uydurma örnek için, def g(row): if row['col1'].method1() == 1: val = row['col1'].method2() / row['col1'].method3(row['col3'], row['col4']) else: val = row['col2'].method5(row['col6']) return np.sin(val) df = pandas.DataFrame(...) …
86 python  pandas 

3
Pandalar / matplotlib çubuk grafiği özel renkleri nasıl verilir
Yığılmış çubuk grafikler oluşturmak için Excel'in yerine panda / matplotlib kullanmaya başladım. Bir sorunla karşılaşıyorum (1) Varsayılan renk haritasında yalnızca 5 renk vardır, bu nedenle 5'ten fazla kategorim varsa renkler tekrar eder. Nasıl daha fazla renk belirleyebilirim? İdeal olarak, bir başlangıç ​​rengi ve bir bitiş rengi olan bir gradyan ve …

3
İki panda Veri Çerçevesini birleştirin (ortak bir sütunda birleştirin)
2 veri çerçevem ​​var: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values name 4503 non-null values neighborhoods 4503 non-null values open 4503 non-null values review_count 4503 non-null values …

6
Pandalar: kategorileri sayılara dönüştürme
Aşağıdaki gibi giden ülkeleri içeren bir veri çerçevem ​​olduğunu varsayalım: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Ülkeleri 'tek sıcak kodlamalara' dönüştürmek için bir pd.get_dummies işlevi olduğunu biliyorum. Ancak, bunun yerine alacağım şekilde onları endekslere dönüştürmek istiyorum cc_index = [1,2,1,3]. Aşağıda gösterildiği …


3
Pandas DataFrame Zaman Farkını Saat ve Dakika Olarak İki Sütun Arasındaki Fark
Ben iki sütun var, fromdateve todatebir dataframe içinde. import pandas as pd data = {'todate': [pd.Timestamp('2014-01-24 13:03:12.050000'), pd.Timestamp('2014-01-27 11:57:18.240000'), pd.Timestamp('2014-01-23 10:07:47.660000')], 'fromdate': [pd.Timestamp('2014-01-26 23:41:21.870000'), pd.Timestamp('2014-01-27 15:38:22.540000'), pd.Timestamp('2014-01-23 18:50:41.420000')]} df = pd.DataFrame(data) diffKullanarak iki tarih arasındaki farkı bulmak için yeni bir sütun ekliyorum df['diff'] = df['fromdate'] - df['todate'] diffSütunu aldım , …

5
Pandas veri çerçevesine sütun olarak numpy dizisi ekleyin
Aşağıdaki gibi görünen bir Pandas veri çerçevesi nesnesi (X, Y) var: [[1, 2, 3], [4, 5, 6], [7, 8, 9]] ve buna benzer bir şekle (X, Z) sahip uyuşmuş bir seyrek matris (CSC) [[0, 1, 0], [0, 0, 1], [1, 0, 0]] Matristen içeriği yeni bir adlandırılmış sütundaki veri çerçevesine …
85 python  numpy  pandas 

6
Veri çerçevesindeki son elemanın erişim dizinine
Bunun için etrafa bakıyorum ama bulamıyorum (son derece önemsiz olsa da). Sahip olduğum sorun, bir veri çerçevesinin ilk ve son girdileri için bir sütunun değerini almak istememdir. Ama yaparsam: df.ix[0]['date'] Alırım: datetime.datetime(2011, 1, 10, 16, 0) ama yaparsam: df[-1:]['date'] Alırım: myIndex 13 2011-12-20 16:00:00 Name: mydate farklı bir formatla. İdeal …
84 python  pandas 


2
Pandalar groupby (). Sum () çıktısından nasıl yeni bir sütun oluşturabilirim?
groupbyHesaplamadan yeni bir sütun oluşturmaya çalışıyorum . Aşağıdaki kodda, her tarih için doğru hesaplanmış değerleri alıyorum (aşağıdaki gruba bakın) ancak onunla yeni bir sütun ( df['Data4']) oluşturmaya çalıştığımda NaN alıyorum. Bu yüzden, dataframe içinde Data3tüm tarihlerin toplamı ile yeni bir sütun oluşturmaya ve bunu her tarih satırına uygulamaya çalışıyorum. Örneğin, …


5
IPython Dizüstü bilgisayar hücresi birden çok çıktı
Bu hücreyi IPython Not Defterinde çalıştırıyorum: # salaries and teams are Pandas dataframe salaries.head() teams.head() Sonuç, teamshem salariesve yerine yalnızca veri çerçevesinin çıktısını alıyorum teams. Sadece çalıştırırsam salaries.head(), salariesveri çerçevesi sonucunu alırım, ancak her iki ifadeyi çalıştırdığımda sadece çıktısını görüyorum teams.head(). Bunu nasıl düzeltebilirim?

6
Seri ve DataFrame nasıl birleştirilir
Buraya bir DataFrameve Seriesdizini nasıl birleştireceğiniz konusunda bilgi almak için geldiyseniz , lütfen bu yanıta bakın . OP'nin asıl amacı, başka bir DataFrame'e sütun olarak seri elemanlarının nasıl atanacağını sormaktı . Bunun cevabını bilmekle ilgileniyorsanız, EdChum tarafından kabul edilen cevaba bakın. Bulabildiğim en iyi şey df = pd.DataFrame({'a':[1, 2], 'b':[3, …

3
Pandalar ve Numpy'de çoklu iş parçacığıyla ilgili garip hata
Numpy işlevinin çoğu varsayılan olarak çoklu okuma özelliğini etkinleştirir. örneğin, bir komut dosyası çalıştırırsam, 8 çekirdekli bir intel cpu iş istasyonunda çalışıyorum import numpy as np x=np.random.random(1000000) for i in range(100000): np.sqrt(x) linux topgibi çalışan sırasında% 800 CPU kullanımını gösterecektir benim iş istasyonu 8 çekirdeğe sahip olduğunu otomatik olarak algılar …
25 python  pandas  numpy 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.