«pandas» etiketlenmiş sorular

Pandas, veri manipülasyonu ve analizi için bir Python kütüphanesidir, örneğin veri çerçeveleri, çok boyutlu zaman serileri ve istatistiklerde, deneysel bilim sonuçlarında, ekonometrikte veya finansta yaygın olarak bulunan kesitsel veri kümeleri. Pandalar, Python'daki ana veri bilimi kütüphanelerinden biridir.

8
Büyük bir panda veri çerçevesini bölme
423244 satırlık büyük bir veri çerçevem ​​var. Bunu 4'e bölmek istiyorum. Hata veren aşağıdaki kodu denedim?ValueError: array split does not result in an equal division for item in np.split(df, 4): print item Bu veri çerçevesi 4 gruba nasıl bölünür?
92 python  pandas 

6
Pandalar DataFrame'den boş hücreler içeren satırları bırak
Bir var pd.DataFramebazı excel elektronik tablolar ayrıştırma tarafından oluşturulduğunu. Bir sütunda boş hücreler var. Örneğin, bu sütunun sıklığı için çıktı aşağıdadır, 32320 kayıt Kiracı için eksik değerlere sahiptir . >>> value_counts(Tenant, normalize=False) 32320 Thunderhead 8170 Big Data Others 5700 Cloud Cruiser 5700 Partnerpedia 5700 Comcast 5700 SDP 5700 Agora 5700 …
92 python  pandas 

4
Get_dummies (Pandalar) ve OneHotEncoder (Scikit-learn) arasındaki artılar ve eksiler nelerdir?
Makine öğrenimi sınıflandırıcıları için kategorik değişkenleri sayısal hale dönüştürmek için farklı yöntemler öğreniyorum. pd.get_dummiesYönteme rastladım ve sklearn.preprocessing.OneHotEncoder()performans ve kullanım açısından nasıl farklı olduklarını görmek istedim. Ben nasıl kullanılacağı hakkında bir öğretici buldum OneHotEncoder()üzerinde https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/ beri sklearndokümantasyon Bu özellikle ilgili çok yararlı değildi. Doğru yapmadığımı hissediyorum ... ama Bazı kullanmanın avantajlarını …

9
CSV dosyasını bir Pandas DataFrame olarak içe aktarın
Bir CSV dosyasında pandalar DataFrame'e okumanın Python yolu nedir (daha sonra istatistiksel işlemler için kullanabilirim, farklı türde sütunlar olabilir, vb.)? CSV dosyam "value.txt"aşağıdaki içeriğe sahip: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 R'de bu dosyayı kullanarak okurduk: price <- read.csv("value.txt") ve bu bir R data.frame döndürür: > price <- …
91 python  pandas  csv  dataframe 

6
çoklu dizinli pandalardan seçim yapmak
'A' ve 'B' sütunlarına sahip çoklu indeksli bir veri çerçevem ​​var. Dizini tek bir sütun dizinine sıfırlamadan çoklu dizinin bir sütununda filtreleme yaparak satırları seçmenin bir yolu var mı? Örneğin. # has multi-index (A,B) df #can I do this? I know this doesn't work because the index is multi-index so …

2
Pandalar ile sekmeyle ayrılmış dosyayı okuma - Windows'ta çalışır, ancak Mac'te çalışmaz
Windows'ta Pandas / Python ile sekmeyle ayrılmış bir veri dosyasını sorunsuz bir şekilde okuyorum. Veri dosyası ilk üç satırda notlar içerir ve ardından bir başlık ile devam eder. df = pd.read_csv(myfile,sep='\t',skiprows=(0,1,2),header=(0)) Şimdi bu dosyayı Mac'imle okumaya çalışıyorum. (Mac'te Python'u ilk kez kullanıyorum.) Aşağıdaki hatayı alıyorum. pandas.parser.CParserError: Error tokenizing data. C …

8
Diske yazmadan AWS S3'teki bir metin dosyasını pandalara aktarma
Sekmeyle ayrılmış bir tablo olan S3'e kaydedilmiş bir metin dosyam var. Onu pandalara yüklemek istiyorum ama önce kaydedemiyorum çünkü bir heroku sunucusunda çalışıyorum. İşte şimdiye kadar sahip olduğum şey. import io import boto3 import os import pandas as pd os.environ["AWS_ACCESS_KEY_ID"] = "xxxxxxxx" os.environ["AWS_SECRET_ACCESS_KEY"] = "xxxxxxxx" s3_client = boto3.client('s3') response = …

2
Pandas DataFrame'i dizine göre nasıl sıralayabilirim?
Aşağıdaki gibi bir DataFrame olduğunda: import pandas as pd df = pd.DataFrame([1, 1, 1, 1, 1], index=[100, 29, 234, 1, 150], columns=['A']) Bu veri çerçevesini, dizin ve sütun değerinin her kombinasyonu bozulmadan dizine göre nasıl sıralayabilirim?
91 python  pandas 

5
pandalar veri çerçevesinde demet sütunu nasıl bölünür?
Pandalar veri çerçevem ​​var (bu sadece küçük bir parça) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV \ …

3
Pandalar: Bir sütunun tüm değerleri nasıl değiştirilir?
Sütun adı verilen bir veri çerçevem ​​var "Date"ve bu sütundaki tüm değerlerin aynı değere sahip olmasını istiyorum (yalnızca yıl). Misal: City Date Paris 01/04/2004 Lisbon 01/09/2004 Madrid 2004 Pekin 31/2004 İstediğim şey: City Date Paris 2004 Lisbon 2004 Madrid 2004 Pekin 2004 İşte kodum: fr61_70xls = pd.ExcelFile('AMADEUS FRANCE 1961-1970.xlsx') #Here …

3
Çok sayfalı Excel elektronik tablosuna DataFrame listesini kaydedin
Bir DataFrame listesini bir Excel elektronik tablosuna nasıl aktarabilirim? Eyalet için dokümanlar to_excel: Notlar Mevcut bir ExcelWriter nesnesini geçiriyorsanız, sayfa mevcut çalışma kitabına eklenecektir. Bu, farklı DataFrame'leri bir çalışma kitabına kaydetmek için kullanılabilir writer = ExcelWriter('output.xlsx') df1.to_excel(writer, 'sheet1') df2.to_excel(writer, 'sheet2') writer.save() Bunu takiben, DataFrame'lerin bir listesini bir elektronik tabloya aşağıdaki …



9
Pandalar kullanarak mevcut bir excel dosyasına yeni bir sayfa nasıl kaydedilir?
Python ile ayrıntılandırılmış verileri depolamak için excel dosyalarını kullanmak istiyorum. Benim sorunum, mevcut bir excel dosyasına sayfa ekleyememem. Burada, bu soruna ulaşmak için çalışabileceğiniz örnek bir kod öneriyorum. import pandas as pd import numpy as np path = r"C:\Users\fedel\Desktop\excelData\PhD_data.xlsx" x1 = np.random.randn(100, 2) df1 = pd.DataFrame(x1) x2 = np.random.randn(100, 2) …

5
Pandalar DataFrame'i iç içe geçmiş sözlükteki öğelerden oluşturun
Şu yapıyla iç içe geçmiş bir 'user_dict' sözlüğüm olduğunu varsayalım: Seviye 1: Kullanıcı Kimliği (Uzun Tamsayı) Seviye 2: Kategori (Dize) Seviye 3: Çeşitli Nitelikler (yüzer, tam sayılar, vb.) Örneğin, bu sözlüğün bir girişi şöyle olacaktır: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": "another"}} …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.