«dataframe» etiketlenmiş sorular

Veri çerçevesi tablo şeklinde bir veri yapısıdır. Genellikle, satırların gözlem olduğu ve sütunların çeşitli türlerde değişkenler olduğu veriler içerir. "Veri çerçevesi" veya "veri çerçevesi" bu kavram için birçok dilde kullanılan terim olsa da (R, Apache Spark, deedle, Maple, Python'daki panda kütüphanesi ve Julia'daki DataFrames kütüphanesi), "tablo" MATLAB ve SQL.


4
Noktaları kullanarak bir panda veri çerçevesinin iki sütunu nasıl çizilir?
Pandalar veri çerçevem ​​var ve bir sütundaki değerlerle başka bir sütundaki değerlerin grafiğini çizmek istiyorum. Neyse ki, plotihtiyacım olan şeyi yapıyor gibi görünen veri çerçeveleriyle ilişkili bir yöntem var : df.plot(x='col_name_1', y='col_name_2') Ne yazık ki, çizim stilleri arasında ( buradakind parametreden sonra listelenmiştir ) puan yok gibi görünüyor . Çizgileri, …



6
Veri çerçevesinin seçilen bir sütununda NA (eksik) değerleri içeren satırların alt kümesi
CSV dosyasından bir veri çerçevemiz var. Veri çerçevesi DF, gözlemlenen değerleri içeren sütunlara ve VaR2ölçümün yapıldığı tarihi içeren bir sütuna ( ) sahiptir. Tarih kaydedilmediyse, CSV dosyası NAeksik veriler için değeri içerir . Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 new_DFYalnızca NA'column ( VaR2) değerine sahip satırları içerecek şekilde …
97 r  csv  dataframe  subset  na 

11
Dataframe hücresi içindeki bir liste ayrı satırlara nasıl patlatılır
Bir liste içeren bir panda hücresini bu değerlerin her biri için satırlara dönüştürmek istiyorum. Öyleyse, şunu al: nearest_neighborsSütundaki değerleri , her bir değerin her opponentdizinde bir satır olacak şekilde paketini açmak ve istiflemek istersem, bu konuda en iyi nasıl hareket edebilirim? Bunun gibi operasyonlar için tasarlanmış panda yöntemleri var mı?

5
Bir veri çerçevesindeki tüm belirli değerleri değiştirin
Bir veri çerçevesine sahip olarak, tüm satırlar ve sütunlar boyunca tüm belirli değerleri değiştirmeye nasıl devam edebilirim. Örneğin, tüm boş kayıtları NA's ile değiştirmek istiyorum (konumları yazmadan): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl 100 Beklenen Sonuç: A B 1 NA …
96 r  dataframe  replace 

5
Listeden veri çerçevesine sütun ekle
Bunun gibi bazı sütunlara sahip bir veri çerçevem ​​var: A B C 0 4 5 6 7 7 6 5 A değerleri mümkün aralık sadece 0 ile 7 arasında olan . Ayrıca, bunun gibi 8 öğeden oluşan bir listem var: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list A …


3
Pandas çubuk grafiklerinde değerlerle çubuklara açıklama ekleyin
Bir Pandas çubuk grafiğindeki çubuklarıma, DataFrame'imden alınan yuvarlatılmış sayısal değerlerle açıklama eklemenin bir yolunu arıyordum. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Bunun gibi bir şey almak istiyorum: Bu kod örneğini denedim, ancak ek açıklamaların tümü x işaretlerine odaklanmıştır: >>> ax = df.plot(kind='bar') >>> …

16
Her grupta maksimum değere sahip satır nasıl seçilir
Her konu için birden çok gözlem içeren bir veri kümesinde, her kayıt için yalnızca maksimum veri değerine sahip bir alt küme almak istiyorum. Örneğin, aşağıdaki veri kümesiyle: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <- data.frame(Subject=ID, pt=Value, Event=Event) Konu 1, 2 ve 3, sırasıyla 5, 17 ve …
94 r  dataframe  r-faq 



6
Pandalar Serisini DataFrame'e dönüştürme
Pandalar serisi sf var: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] Ve bunu aşağıdaki DataFrame'e dönüştürmek istiyorum: index | email | list _____________________________________________ 0 | email1@email.com | [1.0, 0.0, 0.0] 1 | …

6
Pandas Dataframe / Numpy Array "eksen" tanımında belirsizlik
Python eksenlerinin nasıl tanımlandığı ve bir DataFrame'in satırlarına veya sütunlarına atıfta bulunup bulunmadıkları konusunda kafam çok karıştı. Aşağıdaki kodu göz önünde bulundurun: >>> df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], columns=["col1", "col2", "col3", "col4"]) >>> df col1 col2 col3 col4 0 1 1 …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.