«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

2
Python / numpy / pandas'ta rastgele nesnenin NaN olup olmadığını verimli bir şekilde kontrol etmek?
Benim numpy dizilerim np.naneksik değerleri belirtmek için kullanır . Veri seti üzerinde yinelediğimde, bu tür eksik değerleri tespit etmem ve bunları özel yollarla ele almam gerekiyor. Naively kullandım numpy.isnan(val), valdesteklenen türlerin alt kümeleri arasında olmadığı sürece iyi çalışıyor numpy.isnan(). Örneğin, dize alanlarında eksik veriler oluşabilir, bu durumda şunu elde ederim: …
101 python  numpy  pandas 

4
DataFrame'deki dizeler, ancak dtype nesnedir
Pandalar neden bana nesnelerim olduğunu söylüyor, ancak seçili sütundaki her öğe bir dizedir - açık dönüştürmeden sonra bile. Bu benim DataFrame'im: <class 'pandas.core.frame.DataFrame'> Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 non-null values attr3 56992 non-null values …
101 python  pandas  numpy  types  series 


4
DataFrame pandalarında tarihler arasındaki günlerin sayısını içeren sütun ekleyin
"A" daki tarihleri ​​"B" deki tarihlerden çıkarmak ve farkı olan yeni bir sütun eklemek istiyorum. df A B one 2014-01-01 2014-02-28 two 2014-02-03 2014-03-01 Aşağıdakileri denedim, ancak bunu bir for döngüsüne dahil etmeye çalıştığımda bir hata alıyorum ... import datetime date1=df['A'][0] date2=df['B'][0] mdate1 = datetime.datetime.strptime(date1, "%Y-%m-%d").date() rdate1 = datetime.datetime.strptime(date2, "%Y-%m-%d").date() …


2
Pandalar: önceden var olan bir sütundan hesaplanan değerlerle bir veri çerçevesinde iki yeni sütun oluşturun
Ben ile çalışıyorum pandalar kütüphane ve ben bir dataframe iki yeni sütun eklemek istediğiniz dfn sütunda (n> 0) ile. Bu yeni sütunlar, veri çerçevesindeki sütunlardan birine bir işlevin uygulanmasından kaynaklanır. Uygulanacak işlev şuna benzer: def calculate(x): ...operate... return z, y Yalnızca bir değer döndüren bir işlev için yeni bir sütun …
100 python  pandas 



11
FutureWarning: element bazlı karşılaştırma başarısız oldu; skaler döndürüyor, ancak gelecekte element bazlı karşılaştırma yapacak
0.19.1Python 3'te Pandalar kullanıyorum . Bu kod satırlarıyla ilgili bir uyarı alıyorum. PeterSütunda dizenin bulunduğu tüm satır numaralarını içeren bir liste almaya çalışıyorum Unnamed: 5. df = pd.read_excel(xls_path) myRows = df[df['Unnamed: 5'] == 'Peter'].index.tolist() Bir Uyarı oluşturur: "\Python36\lib\site-packages\pandas\core\ops.py:792: FutureWarning: elementwise comparison failed; returning scalar, but in the future will perform …

12
Mongodb'dan pandalara veri nasıl aktarılır?
Mongodb'deki bir koleksiyonda analiz etmem gereken büyük miktarda veriye sahibim. Bu verileri pandalara nasıl aktarırım? Pandalar ve uyuşuklukta yeniyim. DÜZENLEME: Mongodb koleksiyonu, tarih ve saat ile etiketlenmiş sensör değerlerini içerir. Sensör değerleri şamandıra veri türündedir. Örnek veri: { "_cls" : "SensorReport", "_id" : ObjectId("515a963b78f6a035d9fa531b"), "_types" : [ "SensorReport" ], "Readings" …

6
Pandalar csv içe aktarma sırasında satırları atla
Kullanarak bir .csv dosyasını içe aktarmaya çalışıyorum pandas.read_csv(), ancak veri dosyasının 2. satırını (0 indeksleme için indeks = 1 olan satır) içe aktarmak istemiyorum. Bunu nasıl içe aktarmayacağımı göremiyorum çünkü komutla kullanılan argümanlar belirsiz görünüyor: Pandaların web sitesinden: skiprows : liste benzeri veya tam sayı Dosyanın başlangıcında atlanacak satır numaraları …
100 python  csv  pandas 

10
GroupBy pandas DataFrame ve en yaygın değeri seçin
Üç dize sütunu olan bir veri çerçevem ​​var. 3. sütundaki tek değerin ilk ikisinin her kombinasyonu için geçerli olduğunu biliyorum. Verileri temizlemek için veri çerçevesine göre ilk iki sütuna göre gruplandırmalı ve her kombinasyon için üçüncü sütunun en yaygın değerini seçmeliyim. Kodum: import pandas as pd from scipy import stats …

8
Pandaların saat dilimine duyarlı DateTimeIndex öğelerini saf zaman damgasına, ancak belirli bir saat dilimine dönüştür
tz_localizeBir Zaman Damgası veya DateTimeIndex zaman diliminin farkında olmasını sağlamak için işlevi kullanabilirsiniz , ancak bunun tersini nasıl yapabilirsiniz: Zaman dilimi farkında olan bir Zaman Damgasını zaman dilimini korurken nasıl saf bir zamana dönüştürebilirsiniz? Bir örnek: In [82]: t = pd.date_range(start="2013-05-18 12:00:00", periods=10, freq='s', tz="Europe/Brussels") In [83]: t Out[83]: <class …
99 python  pandas 

5
Pandalar veri çerçevesinde Yok'u NaN ile değiştirin
Masam var x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Python Yok'u pandalar NaN ile değiştirmek istiyorum. Denedim: x.replace(to_replace=None, value=np.nan) Ama bende: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or regular expressions, you passed a 'bool' Nasıl devam etmeliyim?

6
Pandalar veri çerçevesini seriye dönüştür
Pandalar konusunda biraz yeniyim. 1 satıra 23 sütunluk bir panda veri çerçevem ​​var. Bunu bir seriye dönüştürmek istiyorum? Bunu yapmanın en pitonik yolunun ne olduğunu merak ediyorum. Denedim pd.Series(myResults)ama şikayet ediyor ValueError: cannot copy sequence with size 23 to array axis with dimension 1. Matematik açısından hala bir "vektör" olduğunu …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.