«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

9
pandas GroupNaN (eksik) değerlere sahip sütunlar
Ben groupby istediğim sütunlarda birçok eksik değerleri olan bir DataFrame var: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} Pandaların NaN hedef değerleri olan satırları bıraktığını görün. (Bu satırları dahil etmek istiyorum!) …

2
Pandalar MultiIndex DataFrame'deki satırları seçin
İndeksi MultiIndex olan bir veri çerçevesinin satırlarını seçmenin / filtrelemenin en yaygın Pandaların yolları nelerdir ? Tek bir değer / etikete göre dilimleme Bir veya daha fazla düzeydeki birden çok etikete göre dilimleme Boole koşullarını ve ifadelerini filtreleme Hangi durumlarda hangi yöntemler uygulanabilir? Basitlik varsayımları: girdi veri çerçevesi yinelenen dizin …

3
Gruplandırılmış Pandalar veri çerçevesi üzerinde nasıl döngü yapılır?
Veri çerçevesi: c_os_family_ss c_os_major_is l_customer_id_i 0 Windows 7 90418 1 Windows 7 90418 2 Windows 7 90418 Kod: print df for name, group in df.groupby('l_customer_id_i').agg(lambda x: ','.join(x)): print name print group Sadece toplanan veriler üzerinde döngü çalışıyorum, ama hatayı alıyorum: ValueError: paketten çıkarılacak çok fazla değer @EdChum, beklenen çıktı: c_os_family_ss …
146 python  pandas 

5
Veriler 3 sete nasıl bölünür (tren, doğrulama ve test)?
Bir panda veri çerçevem ​​var ve bunu 3 ayrı sete bölmek istiyorum. Ben kullanarak biliyorum train_test_split gelen sklearn.cross_validationbir iki set (tren ve test) verileri bölebilirsiniz. Ancak, verileri üç sete bölme konusunda herhangi bir çözüm bulamadım. Tercihen, orijinal verilerin endekslerine sahip olmak istiyorum. Bir çözümün train_test_splitiki kez kullanmak ve bir şekilde …

7
Pandalar veri çerçevesi dolgusu () yalnızca bazı sütunlar yerinde
Yalnızca bazı sütun alt kümesi için 0 ile bir Pandas veri çerçevesinde hiçbir değeri doldurmaya çalışıyorum. Ben yaparken: import pandas as pd df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]}) print df df.fillna(value=0, inplace=True) print df Çıktı: a b c 0 1.0 4.0 NaN 1 2.0 5.0 NaN 2 3.0 NaN 7.0 3 NaN 6.0 …
145 python  pandas  dataframe 

7
Panda kullanarak python'da bir Excel dosyasını okuma
Bir excel dosyasını bu şekilde okumaya çalışıyorum: newFile = pd.ExcelFile(PATH\FileName.xlsx) ParsedData = pd.io.parsers.ExcelFile.parse(newFile) beklenen iki argüman söyleyen bir hata atar, ikinci argümanın ne olduğunu bilmiyorum ve aynı zamanda burada elde etmeye çalıştığım bir Excel dosyasını bir DataFrame dönüştürmek, doğru şekilde mi yapıyorum? ya da panda kullanarak bunu yapmanın başka bir …

10
JSON - Pandalar DataFrame
Ne yapmaya çalışıyorum aşağıdaki gibi enlem ve boylam koordinatları tarafından belirtilen bir yol boyunca bir google haritalar API yükseklik verileri ayıklamak olduğunu: from urllib2 import Request, urlopen import json path1 = '42.974049,-81.205203|42.974298,-81.195755' request=Request('http://maps.googleapis.com/maps/api/elevation/json?locations='+path1+'&sensor=false') response = urlopen(request) elevations = response.read() Bu bana şöyle bir veri veriyor: elevations.splitlines() ['{', ' "results" : …

6
Pandalar: Excel dosyasındaki sayfa listesine bakma
Panda'nın yeni sürümü Excel dosyalarını yüklemek için aşağıdaki arabirimi kullanır : read_excel('path_to_file.xls', 'Sheet1', index_col=None, na_values=['NA']) ama mevcut sayfaları bilmiyorsam ne olur? Örneğin, aşağıdaki sayfalarda bulunan excel dosyalarıyla çalışıyorum Veri 1, Veri 2 ..., Veri N, foo, çubuk ama Na priori bilmiyorum . Pandalar'da bir excel belgesinden sayfa listesini almanın herhangi …
144 python  excel  pandas  openpyxl  xlrd 


5
Panda veri çerçevesinde bir satır alt kümesini değiştirme
A ve B olmak üzere iki sütunlu bir panda DataFrame'im olduğunu varsayalım. Bu DataFrame'i değiştirmek (veya bir kopya oluşturmak), böylece A 0 olduğunda B her zaman NaN olur. Aşağıdakileri denedim df['A'==0]['B'] = np.nan ve df['A'==0]['B'].values.fill(np.nan) başarısız.
143 python  pandas 


8
Pandalar DataFrame Dizinini Yeniden Adlandır
DateTime dizini ile, başlıksız bir csv dosyası var. Dizin ve sütun adını yeniden adlandırmak istiyorum, ancak df.rename () ile yalnızca sütun adı yeniden adlandırılır. Hata? 0.12.0 sürümündeyim In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]], index_col=[0] ) In [3]: df.head() Out[3]: 1 0 2002-06-18 0.112000 2002-06-22 0.190333 2002-06-26 0.134000 2002-06-30 0.093000 …
142 python  pandas  dataframe 

6
Pandalarda bir DataFrame'de "içermez" ifadesini arayın
Bazı araştırmalar yaptım ve bir veri çerçevesini nasıl filtreleyeceğimi bulamıyorum df["col"].str.contains(word), ancak bunun tersini yapmanın bir yolu olup olmadığını merak ediyorum: bir veri çerçevesini bu kümenin iltifatına göre filtreleyin. örneğin: etkisine !(df["col"].str.contains(word)). Bu bir DataFrameyöntemle yapılabilir mi?
142 python  pandas  contains 


11
Panda DataFrame'deki sütun değerlerini değiştirme
Bir veri çerçevesinin bir sütunundaki değerleri değiştirmeye çalışıyorum. Sütun ('dişi') yalnızca 'dişi' ve 'erkek' değerlerini içerir. Aşağıdakileri denedim: w['female']['female']='1' w['female']['male']='0' Ancak önceki sonuçların tam olarak aynı kopyasını alın. İdeal olarak aşağıdaki loop element-wise benzer bazı çıktı almak istiyorum. if w['female'] =='female': w['female'] = '1'; else: w['female'] = '0'; Gotchas belgelerine …
141 python  pandas 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.