«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

5
İki veri çerçevesini dizine göre birleştir
Merhaba ben aşağıdaki dataframes var: > df1 id begin conditional confidence discoveryTechnique 0 278 56 false 0.0 1 1 421 18 false 0.0 1 > df2 concept 0 A 1 B Almak için endeksleri nasıl birleştiririm: id begin conditional confidence discoveryTechnique concept 0 278 56 false 0.0 1 A 1 …

6
Tüm yinelenen satırları Python Pandalara bırak
Bu pandas drop_duplicatesişlev bir veri çerçevesini "ayırmak" için mükemmeldir. Ancak, iletilecek anahtar kelime bağımsız değişkenlerinden biri take_last=Trueveya take_last=Falsesütunların bir alt kümesinde yinelenen tüm satırları bırakmak istiyorum. Mümkün mü? A B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 bar 1 A Örnek olarak, sütunlarla …


6
Pandalar veri çerçevesinde rastgele satır seçimi
Pandalar'da bir DataFrame'den rastgele satır seçmenin bir yolu var mı? Araba paketini kullanan R'de, some(x, n)başa benzer, ancak bu örnekte, x'den rastgele 10 satır seçen kullanışlı bir işlev vardır. Ayrıca dilimleme belgelerine baktım ve eşdeğer bir şey yok gibi görünüyor. Güncelleme Şimdi sürüm 20 kullanılıyor. Örnek bir yöntem var. df.sample(n)
159 python  pandas 



9
Bir Panda Sütununun belirli bir değer içerip içermediğini belirleme
Belirli bir değere sahip bir pandalar sütununda bir giriş olup olmadığını belirlemek için çalışıyorum. Bunu yapmaya çalıştım if x in df['id']. Bunun işe yaradığını düşündüm, ancak sütunda olmadığını bildiğim bir değer verdiğimde 43 in df['id']hala döndü True. Yalnızca eksik tanıtıcıyla eşleşen girdileri içeren bir veri çerçevesine alt kümeye girdiğimde df[df['id'] …
156 python  pandas 


5
Panda groupby dataframe'e anahtarla nasıl erişilir
Bir groupby nesnesindeki ilgili groupby veri çerçevesine tuşuyla nasıl erişebilirim? Aşağıdaki groupby ile: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Anahtarları ve grupları almak için tekrarlayabilirim: In [11]: for k, gp in gb: print 'key=' + str(k) print …

10
Panda Serisinde öğenin dizinini bulun
Bunun çok temel bir soru olduğunu biliyorum ama nedense bir cevap bulamıyorum. Python pandalarında bir Serinin belirli elemanlarının dizinini nasıl alabilirim? (ilk olay yeterli olur) Yani, şöyle bir şey istiyorum: import pandas as pd myseries = pd.Series([1,4,0,7,5], index=[0,1,2,3,4]) print myseries.find(7) # should output 3 Elbette, böyle bir yöntemi bir döngü …
154 python  pandas 

3
Pandalar'da mantıksal indeksleme için mantıksal operatörler
Pandalar'da boole endeksi ile çalışıyorum. Soru, ifadenin neden: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] oysa iyi çalışıyor a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] hatalı çıkar? Misal: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more than one element is ambiguous. Use a.any() …

6
Panda DataFrame veya Serilere birden çok filtre uygulamak için etkili bir yol
Bir kullanıcı bir Pandas DataFrame veya Series nesnesine birkaç filtre uygulamak istediği bir senaryo var. Aslında, kullanıcı tarafından çalışma zamanında belirtilen bir grup filtreleme (karşılaştırma işlemleri) verimli bir şekilde zincirlemek istiyorum. Filtreler katkı maddesi olmalıdır (yani uygulanan her biri sonuçları daraltmalıdır). Şu anda kullanıyorum reindex()ama bu her seferinde yeni bir …
148 python  algorithm  pandas 

14
Groupby ile toplam panda yüzdesi
Bu açıkça basit, ama numpy bir yenidoğan olarak sıkışıp kalıyorum. 3 sütun, devlet, Office kimliği ve o ofis için Satış içeren bir CSV dosyası var. Belirli bir eyalette ofis başına satış yüzdesini hesaplamak istiyorum (her eyaletteki tüm yüzdelerin toplamı% 100'dür). df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3, 'office_id': …
148 python  pandas 

10
Pandas Sütunu içindeki sözlüğü / listeyi Ayrı Sütunlara bölme
PostgreSQL veritabanına kaydedilmiş verilerim var. Bu verileri Python2.7 kullanarak sorguluyorum ve bir Pandas DataFrame'e dönüştürüyorum. Bununla birlikte, bu veri çerçevesinin son sütununun içinde değerler sözlüğü (veya listesi?) Vardır. DataFrame şuna benzer: [1] df Station ID Pollutants 8809 {"a": "46", "b": "3", "c": "12"} 8810 {"a": "36", "b": "5", "c": "8"} …

4
python pandaları: bir seriye argümanları olan bir işlev uygulama
Python pandalar bir dizi bağımsız değişkenleri ile bir işlev uygulamak istiyorum: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) ... Dokümantasyon yöntemini uygulamak bir desteği açıklanır, ancak herhangi bir argüman kabul etmez. Argümanları kabul eden farklı bir yöntem var mı? Alternatif olarak, basit bir geçici çözümü kaçırıyor muyum? Güncelleme (Ekim …
147 python  pandas  apply 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.