Programlama dataframe

20

İndeks kullanarak panda DataFrame'deki belirli bir hücrenin değerini ayarlama

Bir Panda DataFrame oluşturdum df = DataFrame(index=['A','B','C'], columns=['x','y']) ve bunu aldım xy A NaN NaN B NaN NaN C NaN NaN Sonra belirli bir hücreye, örneğin 'C' satırı ve 'x' sütunu için değer atamak istiyorum. Böyle bir sonuç almayı bekledim: xy A NaN NaN B NaN NaN C 10 NaN …

478 python pandas dataframe

10

Pandalar'da harita, uygulama haritası ve uygulama yöntemleri arasındaki fark

Bu vektörleştirme yöntemlerini ne zaman kullanacağımı temel örneklerle söyleyebilir misiniz? Bunun mapbir Seriesyöntem olduğunu , geri kalanı ise yöntem olduğunu görüyorum DataFrame. Ama kafam karıştı applyve applymapyöntemler. DataFrame'e bir işlev uygulamak için neden iki yöntemimiz var? Yine, kullanımı gösteren basit örnekler harika olurdu!

469 python pandas dataframe vectorization

15

Panda veri çerçevesini NumPy dizisine dönüştürme

Nasıl bir panda dataframe bir NumPy dizi dönüştürmek bilmek ilgileniyorum. veri çerçevesi: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = [np.nan, …

468 python arrays pandas numpy dataframe

24

Panda DataFrame'deki bir sütundaki NaN değerleri nasıl sayılır

NaNBazı eşik değerlerden daha azsa, bu sütunları bırakacağım ki, sayısını bulmak istediğim verilerim var . Baktım, ama bunun için herhangi bir işlev bulamadım. var value_counts, ama benim için yavaş olurdu, çünkü değerlerin çoğu farklı ve NaNsadece saymak istiyorum .

464 python pandas dataframe

5

Boş bir Panda DataFrame oluşturma, sonra doldurma?

Buradaki pandalar DataFrame belgelerinden başlıyorum: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Yinelenen DataFrame bir zaman serisi tür hesaplama değerleri ile doldurmak istiyorum. Temel olarak, DataFrame'i A, B sütunları ve zaman damgası satırları, tümü 0 veya tümü NaN ile başlatmak istiyorum. Daha sonra başlangıç değerleri ekler ve bu veriyi, önceki satırdan yeni satırı hesaplayarak söylerdim row[A][t] …

463 python dataframe pandas

12

Panda veri çerçevesinin bir sütununda tüm NaN değerlerini Zeros ile nasıl değiştirebilirim?

Aşağıdaki gibi bir veri çerçevem var itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 11072 75 …

460 python pandas dataframe

7

Panda veri çerçevesinin dizinini bir sütuna nasıl dönüştürebilirim?

Bu oldukça açık görünüyor, ancak veri çerçevesinin bir dizinini bir sütuna nasıl dönüştüğünü anlayamıyorum? Örneğin: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 için, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596

456 python pandas dataframe

11

Panda DataFrame'den kısmi dize ile seçim

Ben DataFrame4 sütun 2 olan dize değerleri içeren var. Belirli bir sütuna karşı kısmi bir dize maç dayalı satır seçmek için bir yol olup olmadığını merak ediyordum? Başka bir deyişle, böyle bir şey yapacak bir işlev veya lambda işlevi re.search(pattern, cell_in_question) bir boole döndürüyor. Ben sözdizimi aşina df[df['A'] == "hello …

448 python string pandas dataframe

9

DataFrame satırlarını karıştır

Aşağıdaki DataFrame var: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ... DataFrame bir csv dosyasından okunur. Type1 olan tüm satırlar üstte, …

438 python pandas dataframe permutation shuffle

7

Pandalar GroupBy kullanarak her grup için istatistik (sayım, ortalama, vb.) Alın?

Bir veri çerçevesi var dfve ondan birkaç sütun kullanın groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Yukarıdaki şekilde neredeyse ihtiyacım olan tabloyu (veri çerçevesi) alıyorum. Eksik olan, her gruptaki satır sayısını içeren ek bir sütundur. Başka bir deyişle, demek istediğim ama aynı zamanda bu araçları elde etmek için kaç tane sayı kullanıldığını da bilmek istiyorum. …

438 python pandas dataframe group-by pandas-groupby

7

Pandas veri çerçevesini SQL'de olduğu gibi 'in' ve 'not in' kullanarak nasıl filtreleyebilirim?

Nasıl SQL en karşılıkları elde edebilirsiniz INve NOT IN? Gerekli değerleri içeren bir listem var. İşte senaryo: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Şu anki bunu yapmam şu şekildedir: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in = …

432 python pandas dataframe sql-function

18

Python ile Pandalar'da CSV dosyasını okurken UnicodeDecodeError

30.000 benzer dosyayı işleyen bir program çalıştırıyorum. Rastgele sayıda kişi bu hatayı durduruyor ve üretiyor ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in read ret …

411 python pandas csv dataframe unicode

15

Birden fazla csv dosyasını pandalara aktarın ve bir DataFrame'e birleştirin

Bir dizinden pandalara birkaç csv dosyası okumak ve bunları büyük bir DataFrame'e birleştirmek istiyorum. Yine de anlayamadım. Şimdiye kadar sahip olduğum şey: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # Concatenate …

403 python pandas csv dataframe concatenation

16

Veri çerçevesinin sütun adlarını değiştirme

"Newprice" adında bir veri çerçevem var (aşağıya bakın) ve R'deki programımdaki sütun adlarını değiştirmek istiyorum. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 Aslında ben de bunu yapıyorum: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Ben her döngü adı gördüğünüz gibi farklı olmasını istiyorum çünkü …

399 r dataframe rename

6

Tam sayı dizinine göre bir dizi panda serisi / veri çerçevesi seçme

Ben neden olarak merak ediyorum df[2]iken, desteklenmez df.ix[2]ve df[2:3]her iki çalışma. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Ben beklenebilir df[2]aynı şekilde çalışması için df[2:3]Python indeksleme kongre ile tutarlı …

395 python pandas dataframe indexing

«dataframe» etiketlenmiş sorular