«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.



7
Pandalar'da birleştirme ve birleştirme arasındaki fark nedir?
Diyelim ki böyle iki DataFrames var: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Onları birleştirmek istiyorum, bu yüzden böyle bir şey deniyorum: pd.merge(left, right, left_on='key1', right_on='key2') Ve ben mutluyum key1 lval key2 rval 0 foo 1 foo 4 1 bar 2 …
208 python  pandas  dataframe  join 

7
Pandalar gruplandırma ve toplama
Bu veri çerçevesini kullanıyorum: Fruit Date Name Number Apples 10/6/2016 Bob 7 Apples 10/6/2016 Bob 8 Apples 10/6/2016 Mike 9 Apples 10/7/2016 Steve 10 Apples 10/7/2016 Bob 1 Oranges 10/7/2016 Bob 2 Oranges 10/6/2016 Tom 15 Oranges 10/6/2016 Mike 57 Oranges 10/6/2016 Bob 65 Oranges 10/7/2016 Tony 1 Grapes 10/7/2016 …

9
Pandas.to_datetime kullanırken yalnızca tarih bölümünü saklayın
pandas.to_datetimeVerilerimdeki tarihleri ​​ayrıştırmak için kullanıyorum . Pandalar datetime64[ns], tarihlerin tümü yalnızca günlük olmasına rağmen varsayılan olarak tarihleri ​​temsil eder . Ben için tarihleri dönüştürmek için zarif / akıllı yolu olup olmadığını merak datetime.dateya datetime64[D]ben CSV veri yazma zaman, tarihler de eklenmeli edilmez, böylece 00:00:00. El ile eleman eleman eleman dönüştürebilirsiniz …
206 python  pandas  csv  datetime  series 


10
Pandalar DataFrame'de belirli bir sütun adını değiştirme
Belirtilen sütun adını bir DataFrame. verileri oynat ... import pandas as pd d = { 'one': [1, 2, 3, 4, 5], 'two': [9, 8, 7, 6, 5], 'three': ['a', 'b', 'c', 'd', 'e'] } df = pd.DataFrame(d) Şimdiye kadar bulduğum en zarif çözüm ... names = df.columns.tolist() names[names.index('two')] = 'new_name' …
200 python  pandas 

17
Pandalar veri çerçevesindeki aykırı değerleri algılama ve hariç tutma
Birkaç sütun ile bir pandalar veri çerçevesi var. Şimdi, belirli satırların belirli bir sütun değerine göre aykırı olduğunu biliyorum. Örneğin 'Vol' sütunu tüm değerlere sahiptir 12xxve bir değer 4000(aykırı değer ) şeklindedir. Şimdi böyle bir Volsütunu olan satırları hariç tutmak istiyorum. Bu nedenle, veri çerçevesine, belirli bir sütunun değerlerinin dahil …

8
İki tarih arasındaki DataFrame satırlarını seçme
Aşağıdaki gibi bir csv bir DataFrame oluşturuyorum: stock = pd.read_csv('data_in/' + filename + '.csv', skipinitialspace=True) DataFrame'in bir tarih sütunu vardır. Yalnızca belirli bir tarih aralığında veya belirtilen iki tarih değeri arasında tarih değerleri olan satırlar içeren yeni bir DataFrame oluşturmanın (veya yalnızca varolan dosyanın üzerine yazmanın) bir yolu var mı?
198 python  pandas 

11
Bir sütun iki sütuna nasıl bölünür?
Bir sütun ile bir veri çerçevesi var ve ben bir sütun başlığı ' fips've diğeri ile iki sütuna bölmek istiyorum'row' Veri çerçevem dfşöyle: row 0 00000 UNITED STATES 1 01000 ALABAMA 2 01001 Autauga County, AL 3 01003 Baldwin County, AL 4 01005 Barbour County, AL df.row.str[:]Satır hücresini bölme hedefime …
197 python  dataframe  pandas 

7
Panda grafiğine x ve y etiketleri ekleme
Pandaları kullanarak çok basit bir şey çizen aşağıdaki kodu olduğunu varsayalım: import pandas as pd values = [[1, 2], [2, 5]] df2 = pd.DataFrame(values, columns=['Type A', 'Type B'], index=['Index 1', 'Index 2']) df2.plot(lw=2, colormap='jet', marker='.', markersize=10, title='Video streaming dropout by category') Belirli renk haritalarını kullanma yeteneğimi korurken x ve y …


15
Pandalı büyük bir csv dosyasını nasıl okurum?
Pandalar büyük bir csv dosyasını (yaklaşık 6 GB) okumaya çalışıyorum ve bir bellek hatası alıyorum: MemoryError Traceback (most recent call last) <ipython-input-58-67a72687871b> in <module>() ----> 1 data=pd.read_csv('aphro.csv',sep=';') ... MemoryError: Bu konuda herhangi bir yardım?
194 python  pandas  csv  memory  chunks 

10
pandalar üç yönlü sütunlarda birden fazla veri karesini birleştirme
3 CSV dosyam var. Her biri, insanların (dize) adları olarak ilk sütuna sahipken, her veri çerçevesindeki diğer tüm sütunlar o kişinin nitelikleridir. Her satır, kişinin dize adının her benzersiz değeri için tüm özniteliklere sahip tek bir CSV oluşturmak için üç CSV belgesinin tümünü birlikte nasıl birleştirebilirim? join()Pandalar belirtiyorsa fonksiyonu bir …
191 python  pandas  join  merge 

4
Python pandalar Bir dizi sütunun veri seçiminden nan filtreleme
Kullanmadan groupbyverileri nasıl filtreleyebilirim NaN? Müşterilerin 'N / A', 'n / a' veya varyasyonlarından herhangi birini dolduracağı ve diğerlerinin boş bırakacağı bir matrisim olduğunu varsayalım: import pandas as pd import numpy as np df = pd.DataFrame({'movie': ['thg', 'thg', 'mol', 'mol', 'lob', 'lob'], 'rating': [3., 4., 5., np.nan, np.nan, np.nan], 'name': …
190 python  pandas  dataframe 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.