«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

11
Panda DataFrame'den kısmi dize ile seçim
Ben DataFrame4 sütun 2 olan dize değerleri içeren var. Belirli bir sütuna karşı kısmi bir dize maç dayalı satır seçmek için bir yol olup olmadığını merak ediyordum? Başka bir deyişle, böyle bir şey yapacak bir işlev veya lambda işlevi re.search(pattern, cell_in_question) bir boole döndürüyor. Ben sözdizimi aşina df[df['A'] == "hello …


7
Pandalar GroupBy kullanarak her grup için istatistik (sayım, ortalama, vb.) Alın?
Bir veri çerçevesi var dfve ondan birkaç sütun kullanın groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Yukarıdaki şekilde neredeyse ihtiyacım olan tabloyu (veri çerçevesi) alıyorum. Eksik olan, her gruptaki satır sayısını içeren ek bir sütundur. Başka bir deyişle, demek istediğim ama aynı zamanda bu araçları elde etmek için kaç tane sayı kullanıldığını da bilmek istiyorum. …

7
Pandas veri çerçevesini SQL'de olduğu gibi 'in' ve 'not in' kullanarak nasıl filtreleyebilirim?
Nasıl SQL en karşılıkları elde edebilirsiniz INve NOT IN? Gerekli değerleri içeren bir listem var. İşte senaryo: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Şu anki bunu yapmam şu şekildedir: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in = …

18
Python ile Pandalar'da CSV dosyasını okurken UnicodeDecodeError
30.000 benzer dosyayı işleyen bir program çalıştırıyorum. Rastgele sayıda kişi bu hatayı durduruyor ve üretiyor ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in read ret …

6
Python / Pandalar'ın kaydedilmiş bir CSV'de dizin oluşturmasını nasıl önleyebilirim?
Dosyada bazı düzenlemeler yaptıktan sonra bir klasöre bir csv kaydetmeye çalışıyorum. Her kullandığımda pd.to_csv('C:/Path of file.csv')Csv dosyasını dizinlerin ayrı bir sütunu var. Dizini csv'ye yazdırmaktan kaçınmak istiyorum. Denedim: pd.read_csv('C:/Path to file to edit.csv', index_col = False) Ve dosyayı kaydetmek için ... pd.to_csv('C:/Path to save edited file.csv', index_col = False) Ancak, …
407 python  csv  indexing  pandas 

15
Birden fazla csv dosyasını pandalara aktarın ve bir DataFrame'e birleştirin
Bir dizinden pandalara birkaç csv dosyası okumak ve bunları büyük bir DataFrame'e birleştirmek istiyorum. Yine de anlayamadım. Şimdiye kadar sahip olduğum şey: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # Concatenate …

6
Tam sayı dizinine göre bir dizi panda serisi / veri çerçevesi seçme
Ben neden olarak merak ediyorum df[2]iken, desteklenmez df.ix[2]ve df[2:3]her iki çalışma. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Ben beklenebilir df[2]aynı şekilde çalışması için df[2:3]Python indeksleme kongre ile tutarlı …

15
Pandalar DataFrame'i değişkenlerdeki değerlerden oluşturmak “ValueError: Tüm skaler değerleri kullanıyorsanız, bir dizin iletmeniz gerekir”
Bu basit bir soru olabilir, ancak bunun nasıl yapılacağını anlayamıyorum. Diyelim ki iki değişkenim var. a = 2 b = 3 Bundan bir DataFrame oluşturmak istiyorum: df2 = pd.DataFrame({'A':a,'B':b}) Bu bir hata oluşturur: ValueError: Tüm skaler değerleri kullanıyorsanız, bir dizin iletmeniz gerekir Bunu da denedim: df2 = (pd.DataFrame({'a':a,'b':b})).reset_index() Bu aynı …

12
Bir işlev Panda'nın veri çerçevesinin iki sütununa nasıl uygulanır?
Diyelim ki dfsütunları olan bir tane var 'ID', 'col_1', 'col_2'. Ve bir fonksiyon tanımlarım: f = lambda x, y : my_function_expression. Şimdi uygulamak istediğiniz fiçin dfbireyin iki sütun 'col_1', 'col_2'öğeye göre hesapla yeni bir sütun 'col_3'biraz gibi: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 arguments …
369 python  pandas  dataframe 

6
Bir Dizinin gerçek değeri belirsizdir. A.empty, a.bool (), a.item (), a.any () veya a.all () kullanın
Sonuç veri çerçevemi bir koşulla filtreleme konusunda sorun yaşıyorum or. Sonucumun 0.25'in üstünde ve -0.25'in altında olan dftüm sütun vardeğerlerini ayıklamasını istiyorum . Aşağıdaki bu mantık bana belirsiz bir gerçek değeri veriyor, ancak bu filtrelemeyi iki ayrı işlemde böldüğümde işe yarıyor. Burada ne oluyor? önerilen nerede kullanılacağından emin değilim a.empty(), …

2
Pandalar Birleştirme 101
Pandalarla bir ( LEFT| RIGHT| FULL) ( INNER| OUTER) birleştirmesi nasıl yapılır ? Birleştirme işleminden sonra eksik satırlar için NaN'leri nasıl eklerim? Birleştirdikten sonra NaN'lerden nasıl kurtulurum? Dizinde birleştirebilir miyim? Pandalar ile çapraz katılmak? Birden çok DataFrame'i nasıl birleştiririm? merge? join? concat? update? DSÖ? Ne? Neden?! ... ve dahası. Pandaların …
366 python  pandas  join  merge 

2
Veri çerçevesi nasıl döndürülür
Pivot nedir? Nasıl dönebilirim? Bu bir pivot mu? Uzun formattan geniş formata? Pivot tablolar hakkında soran birçok soru gördüm. Pivot tablolar hakkında sorular sorduklarını bilmeseler bile, genellikle öyledir. Pivotlamanın tüm yönlerini kapsayan kanonik bir soru ve cevap yazmak neredeyse imkansızdır .... ... Ama bir şans vereceğim. Mevcut sorular ve cevaplar …

11
Veri çerçevesi hücresinden değer nasıl alınır?
Veri çerçevemden tam olarak bir satır ayıklayan bir koşul oluşturdum: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Şimdi belirli bir sütundan bir değer almak istiyorum: val = d2['col_name'] Ama sonuç olarak bir satır ve bir sütun ( yani bir hücre) içeren bir veri çerçevesi alıyorum . İhtiyacım olan …
347 python  pandas  dataframe 

30
Python Pandalar Verileri belirleme hatası
Bir .csv dosyasını işlemek için pandalar kullanmaya çalışıyorum ama bu hatayı alıyorum: pandas.parser.CParserError: Verileri belirleme hatası. C hatası: 3. satırda beklenen 2 alan, testere 12 Panda belgelerini okumaya çalıştım ama hiçbir şey bulamadım. Kodum basit: path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) Bunu nasıl çözebilirim? csvModülü veya başka …
343 python  csv  pandas 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.