«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

14
pandalar: operatör zinciriyle DataFrame satırlarını filtrele
En işlemleri pandasoperatör zincirleme (ile gerçekleştirilebilir groupby, aggregate, apply, vb), ama filtre satırları saptadığımız tek yolu, normal braket endeksleme yoluyladır df_filtered = df[df['column'] == value] dfDeğerlerini filtrelemeden önce bir değişkene atamamı gerektirdiğinden bu çekici değildir . Aşağıdaki gibi bir şey var mı? df_filtered = df.mask(lambda x: x['column'] == value)
329 python  pandas  dataframe 



7
Pandalar read_csv low_memory ve dtype seçenekleri
Ararken df = pd.read_csv('somefile.csv') Alırım: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeUyarı: Sütunların (4,5,7,16) karışık türleri vardır. İçe aktarmada dtype seçeneğini belirtin veya low_memory = False olarak ayarlayın. dtypeSeçenek neden ile ilgilidir low_memoryve neden Falsebu soruna yardımcı olur?


11
Pandalar kullanarak veri çerçevesi nasıl saklanır
Şu anda CSVher komut dosyasını çalıştırdığımda veri çerçevesi olarak oldukça büyük bir içe aktarıyorum . Senaryo çalıştırmak için bekleyen bu veri çerçevesi sürekli kullanılabilir tutmak için iyi bir çözüm var, bu yüzden komut dosyası çalıştırmak için bekleyen tüm zaman harcamak gerekmez?
317 python  pandas  dataframe 

5
pandalar diğer sütunlardaki değerlere dayalı yeni sütunlar oluşturur / satır başına birden çok sütunun işlevini uygular
Ben bu altı sütunların (için (bir if-else merdiveni kullanır) benim özel bir işlev uygulamak istediğiniz ERI_Hispanic, ERI_AmerInd_AKNatv, ERI_Asian, ERI_Black_Afr.Amer, ERI_HI_PacIsl, ERI_Whitebenim dataframe her satırda). Diğer sorulardan farklı yöntemler denedim, ancak yine de sorunum için doğru cevabı bulamıyorum. Bunun kritik parçası, eğer kişi Hispanik olarak sayılırsa, başka bir şey olarak sayılamaz. …
316 python  pandas  numpy  apply 



6
KeyError veren len (dize) içeren koşullu bir ifadeye dayalı olarak panda DataFrame'deki satırları silme
Bir panda DataFrame var ve belirli bir sütundaki dize uzunluğunun 2'den büyük olduğu satırları silmek istiyorum. Bunu ( bu cevap başına ) yapabilmek için bekliyoruz : df[(len(df['column name']) < 2)] ama sadece hatayı alıyorum: KeyError: u'no item named False' Neyi yanlış yapıyorum? (Not: df.dropna()İçerdiği satırlardan kurtulmak için kullanabileceğimi biliyorum NaN, …
303 python  pandas 

7
Pandalar - Belirli bir sütunun ilk satır değerini al
Bu gülünç kolay bir soru gibi görünüyor ... ama beklediğim kolay cevabı görmüyorum. Peki, değeri Pandalar'da belirli bir sütunun n. Satırında nasıl alabilirim? (Özellikle ilk sıraya ilgi duyuyorum, ancak daha genel bir uygulamaya da ilgi duyacağım). Örneğin, değişken olarak Btime'ta 1.2 değerini çekmek istediğimi varsayalım. Bunu yapmanın doğru yolu nedir? …
301 python  pandas  indexing  head 

15
Python dict'i bir veri çerçevesine dönüştürme
Aşağıdaki gibi bir Python sözlüğü var: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06-29': 391, …
299 python  pandas  dataframe 


12
Datetime, Timestamp ve datetime64 arasında dönüştürme
Bir numpy.datetime64nesneyi datetime.datetime(veya Timestamp) haline nasıl dönüştürebilirim ? Aşağıdaki kodda, datetime, zaman damgası ve datetime64 nesneleri oluşturun. import datetime import numpy as np import pandas as pd dt = datetime.datetime(2012, 5, 1) # A strange way to extract a Timestamp object, there's surely a better way? ts = pd.DatetimeIndex([dt])[0] dt64 …
292 python  datetime  numpy  pandas 

8
Panda sayısı (farklı) eşdeğeri
Birden fazla veritabanı (oracle, mssql, vb) var gibi bir db yerine pandalar kullanıyorum ve SQL eşdeğeri için bir komut dizisi yapamıyorum. Bazı sütunlarla DataFrame yüklü bir tablo var: YEARMONTH, CLIENTCODE, SIZE, .... etc etc SQL'de, yılda farklı müşteri miktarını saymak şöyle olur: SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH; …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.