«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

12
Jupyter dizüstü bilgisayar iki panda masasını yan yana görüntüler
İki panda veri çerçevem ​​var ve bunları Jupyter not defterinde görüntülemek istiyorum. Şunun gibi bir şey yapmak: display(df1) display(df2) Bunları birbirinin altında gösterir: İlkinin sağında ikinci bir veri çerçevesine sahip olmak istiyorum. Orada da benzer bir soru , ama bir kişinin aralarındaki farkı gösteren bir dataframe bunları birleştirme ile ya …

2
Pandalarda belirli koşulların karşılandığı satır değerlerini güncelleme
Aşağıdaki veri çerçevesine sahip olduğumu varsayalım: Akışın 2 numara olduğu feat ve another_feat sütunlarının değerlerini güncellemenin en etkili yolu nedir ? Bu mu? for index, row in df.iterrows(): if df1.loc[index,'stream'] == 2: # do something GÜNCELLEME: 100'den fazla sütunum varsa ne yapmalıyım? Güncellemek istediğim sütunları açıkça adlandırmak istemiyorum. Her sütunun …

3
Beyaz alanı Pandas DataFrame üstbilgilerinden nasıl çıkarabilirim?
Bazı sütun başlıklarında fazladan beyaz boşluk bulunan bir Excel dosyasındaki verileri ayrıştırıyorum. Elde edilen veri çerçevesinin sütunlarını kontrol ettiğimde df.columns, şunu görüyorum: Index(['Year', 'Month ', 'Value']) ^ # Note the unwanted trailing space on 'Month ' Sonuç olarak şunları yapamam: df["Month"] Çünkü bana "Ay" değil, "Ay" istediğim gibi sütunun bulunmadığını …

6
Pandalar yinelemelerinde performans sorunları var mı?
Pandaların yinelemelerini kullanırken çok düşük performans fark ettim. Bu başkaları tarafından deneyimlenen bir şey mi? Yinelemelere özel mi ve belirli bir boyuttaki veriler için bu işlevden kaçınılmalı mı (2-3 milyon satırla çalışıyorum)? GitHub'daki bu tartışma , bunun veri çerçevesindeki dtype'ları karıştırırken ortaya çıktığına inanmamı sağladı, ancak aşağıdaki basit örnek, bir …

11
Dataframe hücresi içindeki bir liste ayrı satırlara nasıl patlatılır
Bir liste içeren bir panda hücresini bu değerlerin her biri için satırlara dönüştürmek istiyorum. Öyleyse, şunu al: nearest_neighborsSütundaki değerleri , her bir değerin her opponentdizinde bir satır olacak şekilde paketini açmak ve istiflemek istersem, bu konuda en iyi nasıl hareket edebilirim? Bunun gibi operasyonlar için tasarlanmış panda yöntemleri var mı?

6
Pandalar barplotta x ekseni işaret etiketleri nasıl döndürülür
Aşağıdaki kodla: import matplotlib matplotlib.style.use('ggplot') import matplotlib.pyplot as plt import pandas as pd df = pd.DataFrame({ 'celltype':["foo","bar","qux","woz"], 's1':[5,9,1,7], 's2':[12,90,13,87]}) df = df[["celltype","s1","s2"]] df.set_index(["celltype"],inplace=True) df.plot(kind='bar',alpha=0.75) plt.xlabel("") Bu komployu yaptım: X ekseni onay etiketlerini 0 dereceye nasıl döndürebilirim? Bunu eklemeyi denedim ama işe yaramadı: plt.set_xticklabels(df.index,rotation=90)


9
Python Pandas'ın JavaScript'teki eşdeğeri
Bu CSV örneğiyle: Source,col1,col2,col3 foo,1,2,3 bar,3,4,5 Pandaları kullandığım standart yöntem şudur: CSV'yi ayrıştır Bir veri çerçevesine sütun seçin ( col1ve col3) Sütunu işleyin (örneğin, col1ve değerlerini ortalama col3) Pandalar gibi yapan bir JavaScript kitaplığı var mı?

5
Matplotlib çubuk grafiğine değer etiketleri ekleme
Nispeten kolay olması gerektiğini düşünen bir şeye takıldım. Aşağıda getirdiğim kod, üzerinde çalıştığım daha büyük bir projeye dayalı bir örnek. Tüm ayrıntıları göndermek için bir neden görmedim, bu yüzden lütfen getirdiğim veri yapılarını olduğu gibi kabul edin. Temel olarak, bir çubuk grafik oluşturuyorum ve çubuklara (çubuğun ortasında veya hemen üstünde) …

3
Pandalar toplu sayım farklı
Diyelim ki bir kullanıcı etkinliği günlüğüm var ve toplam süre ve günlük benzersiz kullanıcı sayısı raporu oluşturmak istiyorum. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id': ['0001', '0001', '0002', '0002', '0002'], 'duration': [30, 15, 20, 15, 30]}) Toplama süresi oldukça basittir: group = df.groupby('date') …
95 python  pandas 

5
Listeden veri çerçevesine sütun ekle
Bunun gibi bazı sütunlara sahip bir veri çerçevem ​​var: A B C 0 4 5 6 7 7 6 5 A değerleri mümkün aralık sadece 0 ile 7 arasında olan . Ayrıca, bunun gibi 8 öğeden oluşan bir listem var: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list A …


3
Pandas çubuk grafiklerinde değerlerle çubuklara açıklama ekleyin
Bir Pandas çubuk grafiğindeki çubuklarıma, DataFrame'imden alınan yuvarlatılmış sayısal değerlerle açıklama eklemenin bir yolunu arıyordum. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Bunun gibi bir şey almak istiyorum: Bu kod örneğini denedim, ancak ek açıklamaların tümü x işaretlerine odaklanmıştır: >>> ax = df.plot(kind='bar') >>> …

1
Tüy ve parke arasındaki farklar nelerdir?
Her ikisi de veri analiz sistemlerinde kullanım için sütunlu (disk) depolama formatlarıdır . Her ikisi de entegre edilmiştir Apache Ok ( pyarrow piton paket) ile eşleşecek şekilde tasarlanmıştır Ok sütunlu bir bellek analiz tabaka olarak kullanılır. Her iki format nasıl farklılık gösterir? Pandalarla çalışırken her zaman tüyü tercih etmeli misiniz? …

10
Pandas'taki sütun adlarına göre birden çok sütunu silme
Bazı verilerim var ve bunları içe aktardığımda aşağıdaki gereksiz sütunları alıyorum, bunların hepsini silmenin kolay bir yolunu arıyorum 'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27', 'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31', 'Unnamed: 32', 'Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36', 'Unnamed: 37', 'Unnamed: 38', 'Unnamed: 39', …
94 python  pandas 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.