«dataframe» etiketlenmiş sorular

Veri çerçevesi tablo şeklinde bir veri yapısıdır. Genellikle, satırların gözlem olduğu ve sütunların çeşitli türlerde değişkenler olduğu veriler içerir. "Veri çerçevesi" veya "veri çerçevesi" bu kavram için birçok dilde kullanılan terim olsa da (R, Apache Spark, deedle, Maple, Python'daki panda kütüphanesi ve Julia'daki DataFrames kütüphanesi), "tablo" MATLAB ve SQL.


4
Pandalar read_csv'deki datetime dtypes
Birden çok tarih saat sütunu olan bir csv dosyasında okuyorum. Dosyayı okurken veri türlerini ayarlamam gerekir, ancak veri zamanları bir sorun gibi görünüyor. Örneğin: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Çalıştırma bir hata verdiğinde: TypeError: "datetime" veri türü anlaşılmadı …

10
Dataframe'i csv'ye doğrudan s3 Python'a kaydedin
Yeni bir CSV dosyasına yüklemek istediğim bir panda DataFrame'im var. Sorun şu ki, dosyayı s3'e aktarmadan önce yerel olarak kaydetmek istemiyorum. Dataframe'i doğrudan s3'e yazmak için to_csv gibi bir yöntem var mı? Boto3 kullanıyorum. Şimdiye kadar sahip olduğum şeyler: import boto3 s3 = boto3.client('s3', aws_access_key_id='key', aws_secret_access_key='secret_key') read_file = s3.get_object(Bucket, Key) …

4
Pandalar'da iki sütundan tuple sütunu nasıl oluşturulur
Pandas DataFrame'im var ve bir demet oluşturmak için 'enlem' ve 'uzun' sütunları birleştirmek istiyorum. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 non-null values …

2
Pandalar ile rastgele tam sayılardan oluşan bir DataFrame nasıl oluşturulur?
Ben kullanırsanız bunu biliyorum randn, import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD')) bana aradığımı verir, ancak normal dağılımdan öğelerle. Ama ya sadece rastgele tamsayılar istersem? randintbir aralık sağlayarak çalışır, ancak randnyaptığı gibi bir dizi sağlamaz. Peki bunu bir aralık arasında rastgele tamsayılarla nasıl yaparım?

12
data.frame satırları bir listeye
Satırlara göre bir listeye dönüştürmek istediğim bir data.frame var, yani her satır kendi liste öğelerine karşılık gelir. Başka bir deyişle, data.frame'in satırları olduğu sürece bir liste istiyorum. Şimdiye kadar, bu sorunu aşağıdaki şekilde ele aldım, ancak buna yaklaşmanın daha iyi bir yolu olup olmadığını merak ediyordum. xy.df <- data.frame(x = …
123 list  r  dataframe 

3
Her satır için maksimum değere sahip sütun adını bulun
Bunun gibi bir DataFrame'im var: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Burada her satır için maksimum değeri olan sütun adını nasıl …
123 python  pandas  dataframe  max 

8
$ Ve bir karakter değeri kullanarak veri çerçevesi sütunlarını dinamik olarak seçin
Farklı sütun adlarından oluşan bir vektörüm var ve bir data.frame'den bu sütunu çıkarmak için her birinin üzerinde döngü yapabilmek istiyorum. Örneğin, veri kümesini mtcarsve bir karakter vektöründe depolanan bazı değişken adlarını düşünün cols. mtcarsDinamik alt kümesini kullanarak bir değişken seçmeye çalıştığımda cols, bunların nether cols <- c("mpg", "cyl", "am") col …
122 r  dataframe  r-faq 


7
R veri çerçevesine satırlar nasıl eklenir
StackOverflow'a baktım, ancak bir R veri çerçevesine satır eklemeyi içeren sorunuma özel bir çözüm bulamıyorum. Aşağıdaki gibi 2 sütunlu boş bir veri çerçevesi başlatıyorum. df = data.frame(x = numeric(), y = character()) Daha sonra amacım, bir değerler listesini yinelemek ve her yinelemede listenin sonuna bir değer eklemektir. Aşağıdaki kodla başladım. …
121 r  merge  append  dataframe  rows 

3
pandalar uygulama işlevindeki bir satırın dizinini alma
DataFramePandas'ta bir bütün için uygulanan bir işlevdeki bir satırın dizinine erişmeye çalışıyorum . Bende böyle bir şey var: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 ve belirli bir satırdaki öğelere erişen bir işlev tanımlayacağım def rowFunc(row): return row['a'] + row['b'] …
121 python  pandas  dataframe 

14
Her gruptaki satır sayısını sayın
Bir veri çerçevem ​​var ve her gruptaki satır sayısını saymak istiyorum. aggregateVerileri toplamak için işlevi düzenli olarak aşağıdaki gibi kullanıyorum: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Şimdi, gözlemleri saymak istiyorum ama uygun argümanı bulamıyorum FUN. Sezgisel olarak, aşağıdaki gibi olacağını düşündüm: df2 <- aggregate(x ~ …
121 r  dataframe  aggregate  r-faq 



9
Pandalar uygulamasından birden çok sütun döndür ()
Pandalarım var DataFrame df_test,. Bayt cinsinden boyutu temsil eden bir sütun 'boyut' içerir. Aşağıdaki kodu kullanarak KB, MB ve GB hesapladım: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) + ' KB') df_test['size_mb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.