«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

7
Bir csv okurken pandalarda dizin sütununu kaldırma
Bir CSV dosyasını içe aktaran aşağıdaki koda sahibim. 3 sütun var ve ilk ikisini değişkenler olarak ayarlamak istiyorum. İkinci sütunu "verimlilik" değişkenine ayarladığımda, indeks sütunu da işaretleniyor. İndeks sütunundan nasıl kurtulabilirim? df = pd.DataFrame.from_csv('Efficiency_Data.csv', header=0, parse_dates=False) energy = df.index efficiency = df.Efficiency print efficiency Kullanmayı denedim del df['index'] ben ayarladıktan …
128 python  pandas 

5
Pandalar veri çerçevesine eksik tarihleri ​​ekleyin
Verilerim belirli bir tarihte birden çok olay içerebilir veya bir tarihte olay YOK olabilir. Bu olayları alıyorum, tarihe göre sayıyorum ve planlıyorum. Ancak, onları çizdiğimde, iki serim her zaman eşleşmiyor. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() Yukarıdaki kodda idx , 30 tarih aralığı haline gelir. 09-01-2013 ila 09-30-2013 Ancak …
128 python  date  plot  pandas  dataframe 


8
İki sütun arasındaki korelasyonu elde etmek için .corr kullanın
Aşağıdaki pandalar veri çerçevesine sahibim Top15: Kişi başına alıntı yapılabilir belge sayısını tahmin eden bir sütun oluşturuyorum: Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita'] Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst'] Kişi başına atıfta bulunulabilir belge sayısı ile kişi başına enerji arzı arasındaki ilişkiyi bilmek istiyorum. …

4
Pandalar read_csv'deki datetime dtypes
Birden çok tarih saat sütunu olan bir csv dosyasında okuyorum. Dosyayı okurken veri türlerini ayarlamam gerekir, ancak veri zamanları bir sorun gibi görünüyor. Örneğin: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Çalıştırma bir hata verdiğinde: TypeError: "datetime" veri türü anlaşılmadı …

6
Pandalar birleştirmeyi kullanırken dizin nasıl korunur?
İkisini birleştirmek istiyorum DataFrames ve ilk çerçevedeki dizini birleştirilmiş veri kümesindeki dizin olarak tutmak . Ancak, birleştirmeyi yaptığımda, sonuçta elde edilen DataFrame tamsayı indeksine sahip. İndeksi sol veri çerçevesinden korumak istediğimi nasıl belirtebilirim? In [4]: a = pd.DataFrame({'col1': {'a': 1, 'b': 2, 'c': 3}, 'to_merge_on': {'a': 1, 'b': 3, 'c': …
126 python  pandas 


9
python pandaları yinelenen sütunları kaldırır
Bir veri çerçevesinden yinelenen sütunları kaldırmanın en kolay yolu nedir? Yinelenen sütunları olan bir metin dosyasını şu şekilde okuyorum: import pandas as pd df=pd.read_table(fname) Sütun adları: Time, Time Relative, N2, Time, Time Relative, H2, etc... Tüm Zaman ve Zaman Göreceli sütunları aynı verileri içerir. İstiyorum: Time, Time Relative, N2, H2 …
126 python  pandas 

4
Pandalar'da iki sütundan tuple sütunu nasıl oluşturulur
Pandas DataFrame'im var ve bir demet oluşturmak için 'enlem' ve 'uzun' sütunları birleştirmek istiyorum. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 non-null values …

2
Pandalar ile rastgele tam sayılardan oluşan bir DataFrame nasıl oluşturulur?
Ben kullanırsanız bunu biliyorum randn, import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD')) bana aradığımı verir, ancak normal dağılımdan öğelerle. Ama ya sadece rastgele tamsayılar istersem? randintbir aralık sağlayarak çalışır, ancak randnyaptığı gibi bir dizi sağlamaz. Peki bunu bir aralık arasında rastgele tamsayılarla nasıl yaparım?

6
Koşullu Değiştirme Pandaları
Bir DataFrame'im var ve belirli bir sütundaki değerleri sıfır ile aşan değerleri değiştirmek istiyorum. Bunu başarmanın bir yolu olduğunu düşünmüştüm: df[df.my_channel > 20000].my_channel = 0 Kanalı yeni bir veri çerçevesine kopyalarsam çok basit: df2 = df.my_channel df2[df2 > 20000] = 0 Bu tam olarak istediğimi yapıyor, ancak orijinal DataFrame'in bir …

3
Her satır için maksimum değere sahip sütun adını bulun
Bunun gibi bir DataFrame'im var: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Burada her satır için maksimum değeri olan sütun adını nasıl …
123 python  pandas  dataframe  max 

8
Pandalar groupby: Bir dizi birliği nasıl elde edilir
Bunun gibi bir veri çerçevem ​​var: A B C 0 1 0.749065 This 1 2 0.301084 is 2 3 0.463468 a 3 4 0.643961 random 4 1 0.866521 string 5 2 0.120737 ! çağrı In [10]: print df.groupby("A")["B"].sum() dönecek A 1 1.615586 2 0.421821 3 0.463468 4 0.643961 Şimdi "C" …
122 python  pandas 


3
pandalar uygulama işlevindeki bir satırın dizinini alma
DataFramePandas'ta bir bütün için uygulanan bir işlevdeki bir satırın dizinine erişmeye çalışıyorum . Bende böyle bir şey var: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 ve belirli bir satırdaki öğelere erişen bir işlev tanımlayacağım def rowFunc(row): return row['a'] + row['b'] …
121 python  pandas  dataframe 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.