«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

8
Pandalar / Pyplot'ta dağılım grafikleri: Kategoriye göre nasıl çizim yapılır
Bir Pandas DataFrame nesnesi kullanarak pyplot'ta basit bir dağılım grafiği yapmaya çalışıyorum, ancak iki değişkeni çizmenin etkili bir yolunu istiyorum, ancak sembollerin üçüncü bir sütun (anahtar) tarafından dikte edilmesini istiyorum. Df.groupby kullanarak çeşitli yollar denedim, ancak başarılı olamadım. Örnek bir df komut dosyası aşağıdadır. Bu, işaretçileri "key1" e göre renklendirir, …

4
Pandalar'da yalnızca sıfır içeren bir sütunu nasıl silerim?
Şu anda değer olarak 1 ve 0 olan sütunlardan oluşan bir veri çerçevem ​​var, sütunlarda yinelemek ve sadece 0'lardan oluşanları silmek istiyorum. İşte şimdiye kadar denediklerim: ones = [] zeros = [] for year in years: for i in range(0,599): if year[str(i)].values.any() == 1: ones.append(i) if year[str(i)].values.all() == 0: zeros.append(i) …
90 python  pandas 

13
İki veri çerçevesini karşılaştırma ve farklılıkları elde etme
İki veri çerçevem ​​var. Örnekler: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 Apple 22.1 …



1
Paralel olarak gruplanmış pandalar DataFrame'e verimli bir şekilde bir işlev uygulama
Çok büyük DataFrame(karma veri türleri) gruplarına sıklıkla bir işlev uygulamam gerekir ve birden çok çekirdekten yararlanmak isterim. Gruplardan bir yineleyici oluşturabilir ve çoklu işlem modülünü kullanabilirim, ancak verimli değildir çünkü süreçler arasında mesajlaşma için her grup ve işlevin sonuçları seçilmelidir. Asitlemeden kaçınmanın veya hatta DataFrametamamen kopyalanmasını önlemenin bir yolu var …

7
Pandalarda merge () ve concat () arasındaki fark (lar)
Arasındaki temel fark (lar) nedir pd.DataFrame.merge()ve pd.concat()? Şimdiye kadar bulduğum şey buydu, lütfen anlayışımın ne kadar eksiksiz ve doğru olduğunu yorumlayın: .merge()yalnızca sütunları (artı satır indisleri) kullanabilir ve anlamsal olarak veritabanı tarzı işlemler için uygundur. .concat()sadece endeksler kullanılarak her iki eksenle de kullanılabilir ve hiyerarşik bir dizin ekleme seçeneği sunar. …
89 python  pandas  join  merge  concat 

1
Pandalarda Çoklu Dizin Sıralama
Belirli bir sütundaki değerlere göre sıralamak istediğim bir pandas df'de çoklu dizin sütunlarına sahip bir veri kümem var. Sortindex ve sortlevel kullanmayı denedim ama aradığım sonuçları alamadım. Veri kümem şöyle görünüyor: Group1 Group2 A B C A B C 1 1 0 3 2 5 7 2 5 6 9 …

5
Aynı IPython Notebook hücresinde birden fazla grafik oluşturun
IPython Defterime başladım ipython notebook --pylab inline Bu tek hücredeki kodum df['korisnika'].plot() df['osiguranika'].plot() Bu iyi çalışıyor, iki çizgi çizecek, ancak aynı grafik üzerinde. Her çizgiyi ayrı bir grafik üzerine çizmek istiyorum. Ve grafikler birbiri ardına değil, yan yana olsaydı harika olurdu. İkinci satırı bir sonraki hücreye koyabileceğimi biliyorum ve sonra …

1
DataFrame'deki her hücreye işlev uygulayın
Şuna benzeyen bir veri çerçevem ​​var: A B C foo bar foo bar bar foo foo bar Her satırın her öğesine (veya her sütunun her öğesine) bakmak ve sonraki DF'yi elde etmek için aşağıdaki işlevi uygulamak istiyorum: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar wow bar bar …


1
Pandalar zaman serileri, x ekseni büyük ve küçük işaretler ve etiketler ayarlıyor
Bir Pandas zaman serisi nesnesinden çizilen bir zaman serisi grafiği için büyük ve küçük xticks ve etiketlerini ayarlayabilmek istiyorum. Pandas 0.9 "yenilikler" sayfası şunu söylüyor: "to_pydatetime kullanabilir veya Zaman Damgası türü için bir dönüştürücü kaydedebilirsiniz" ancak matplotlib ax.xaxis.set_major_locatorve ax.xaxis.set_major_formatter(ve minör) komutlarını kullanabilmek için bunu nasıl yapacağımı çözemiyorum . Bunları pandaların …

3
numpy.timedelta64 değerinden günleri ayıklama
Pandalar / python kullanıyorum ve tarihler / saatler içeren df'nin bir alanında 'to_datetime' işlevi kullanılarak oluşturulmuş iki tarih saat serisi s1 ve s2 var. S1'i s2'den çıkardığımda s3 = s2 - s1 Bir dizi s3 alıyorum timedelta64 [ns] 0 385 days, 04:10:36 1 57 days, 22:54:00 2 642 days, 21:15:23 …
87 python  numpy  pandas 

8
Pandalar: zaman aralığına göre değişen ortalama
Pandalar'da yeniyim .... Elimde bir sürü anket verisi var; Üç günlük bir pencereye dayalı olarak her gün için bir tahmin elde etmek için değişen bir ortalama hesaplamak istiyorum. Bu sorudan anladığım kadarıyla , rolling_ * işlevleri pencereyi belirli bir tarih-saat aralığına değil, belirli bir değer sayısına göre hesaplar. Bu işlevi …

2
Seaborn lmplot facetgrid'de biraz xlim ve ylim nasıl ayarlanır
Veri kümemi kategorik bir değişkenle iki gruba bölerek doğrusal bir regresyonu çizmek için Seaborn'un lmplot'unu kullanıyorum. Hem x hem de y için, her iki grafikte de alt sınırı manuel olarak ayarlamak istiyorum , ancak üst sınırı Seaborn varsayılanında bırakmak istiyorum. İşte basit bir örnek: import pandas as pd import seaborn …
87 python  pandas  seaborn 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.