«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.


7
Panda sütununun bir listedeki tüm öğeleri içerip içermediğini kontrol edin
Ben böyle bir df var: frame = pd.DataFrame({'a' : ['a,b,c', 'a,c,f', 'b,d,f','a,z,c']}) Ve bir öğe listesi: letters = ['a','c'] Amacım frame, en az 2 öğeyi içeren tüm satırları elde etmektir.letters Bu çözümü buldum: for i in letters: subframe = frame[frame['a'].str.contains(i)] Bu bana istediğimi veriyor, ancak ölçeklenebilirlik açısından en iyi çözüm …
20 python  pandas 

5
Her değişken için stoktan çıkış ve dönüş değeri sayıları?
19717 kişinin programlama dili seçimini çoktan seçmeli sorularla yanıtlayan bir veri çerçevem ​​var. İlk sütun elbette cevap verenin cinsiyeti iken geri kalanı seçtikleri seçimlerdir. Bu nedenle Python'u seçersem, yanıtım bash yerine Python sütununa kaydedilir ve tersi de geçerlidir. ID Gender Python Bash R JavaScript C++ 0 Male Python nan nan …


3
Panda veri çerçevesini hiyerarşik sözlüğe dönüştürme
Aşağıdaki pandalar veri çerçevesi var: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) Gömülü sözlüğün değerleri listeler gibi olan hiyerarşik bir sözlük oluşturmaya çalışıyorum: {200101: {1:[350, 400], 2:[200, 250]}, 200102: {1:[100, 300], 2:[450, 400]}} Bunu nasıl yaparım? En yakın ben bu kodu kullanıyor: df1.set_index('date').groupby(level='date').apply(lambda x: x.set_index('blockcount').squeeze().to_dict()).to_dict() Hangi döndürür: {200101: {1: 400, 2: …
16 python  pandas 


5
Satırları indekslerken ve eklerken panda veri çerçevelerinin zorlanmasını önleyin
Panda veri çerçevelerinin tek tek satırlarıyla çalışıyorum, ancak satırları indekslerken ve eklerken zorlama sorunları üzerinde tökezliyorum. Pandalar her zaman karışık bir int / float'tan tüm-float türlerine zorlamak istiyor gibi görünüyor ve bu davranış üzerinde belirgin kontroller göremiyorum. Örneğin, aas intve bas ile basit bir veri çerçevesi float: import pandas as …

6
Hızlıca simetrik çiftleri bulun
from itertools import product import pandas as pd df = pd.DataFrame.from_records(product(range(10), range(10))) df = df.sample(90) df.columns = "c1 c2".split() df = df.sort_values(df.columns.tolist()).reset_index(drop=True) # c1 c2 # 0 0 0 # 1 0 1 # 2 0 2 # 3 0 3 # 4 0 4 # .. .. .. # …
15 python  pandas  numpy 

3
Pandalardaki iki coğrafi veri çerçevesi ile en yakın mesafeyi alın
İşte ilk geodatframe'im: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) City1 City Country …


2
Hangi sütunların tarih olduğunu belirle
Birçoğu tür olan birçok sütun ile büyük bir veri çerçevesi var datetime.datetime. Sorun, birçoğunun, örneğin datetime.datetimedeğerler veNone değerler (ve potansiyel olarak diğer geçersiz değerler) : 0 2017-07-06 00:00:00 1 2018-02-27 21:30:05 2 2017-04-12 00:00:00 3 2017-05-21 22:05:00 4 2018-01-22 00:00:00 ... 352867 2019-10-04 00:00:00 352868 None 352869 some_string Name: colx, …
14 python  pandas 

7
AttributeError: 'DataFrame' nesnesinin 'ix' özelliği yok
Bir sütun, örneğin df.ix [:, 'col_header'] çekmek için bir pandalar veri çerçevesinin .ix özniteliğini kullanmaya çalıştığınızda yukarıdaki hatayı alıyorum. Senaryo bu sabah itibariyle işe yaradı, ancak bu öğleden sonra yeni bir Linux ortamında yeni bir Panda yüklemesiyle çalıştırdım. Bu hatayı daha önce gören var mı? Burada ve başka yerlerde aradım …

3
[:] Ve iloc [:] ile atamak pandalarda neden farklı sonuçlar veriyor?
ilocPandalarda kullanılan farklı indeksleme yöntemleri ile çok karıştım. Diyelim ki bir 1-d Dataframe'i 2-d Dataframe'e dönüştürmeye çalışıyorum. İlk olarak aşağıdaki 1-D Dataframe var a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T Ve bunu 2 boyutlu bir Dataframe'e dönüştüreceğim 2x4. 2-boyutlu Dataframe'i aşağıdaki gibi hazırlayarak başlıyorum: b_df = pd.DataFrame(columns=range(4),index=range(2)) Daha sonra for-loop'u a_df(1-d) …

3
Yavaş pandalar DataFrame MultiIndex reindex
Bir panda DataFrame formun var: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 2019-12-01 00:51:14+00:00 114430 …

1
Pandaların ex_excel işlevi beklenmeyen bir TypeError oluşturur
Panda dataframe sözlüğü oluşturdum: d[k] = pd.DataFrame(data=data[i]) Bu yüzden d[k]doğru bir panda veri çerçevesi olduğunu varsayıyorum . Sonra for k in d.keys(): d[k].to_excel (file_name) Sonra hata var: TypeError: got invalid input value of type <class 'xml.etree.ElementTree.Element'>, expected string or Element Python 3.7, pandalar 0.25.3 kullanıyorum. Güncelleme : Ben değiştirirseniz to_exceltarafından …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.