«dataframe» etiketlenmiş sorular

Veri çerçevesi tablo şeklinde bir veri yapısıdır. Genellikle, satırların gözlem olduğu ve sütunların çeşitli türlerde değişkenler olduğu veriler içerir. "Veri çerçevesi" veya "veri çerçevesi" bu kavram için birçok dilde kullanılan terim olsa da (R, Apache Spark, deedle, Maple, Python'daki panda kütüphanesi ve Julia'daki DataFrames kütüphanesi), "tablo" MATLAB ve SQL.


6
pandalar: Bir sütundaki metni birden çok satıra nasıl bölerim?
Ben büyük bir csv dosyası ile çalışıyorum ve son sütunun yanındaki belirli bir sınırlayıcı tarafından bölmek istediğiniz bir metin dizesi vardır. Pandalar veya python kullanarak bunu yapmanın basit bir yolu olup olmadığını merak ediyordum? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John …
135 python  pandas  dataframe 

4
Python pandaları: bir veri çerçevesi satırını satır satır doldurun
Bir pandas.DataFramenesneye bir satır eklemenin basit görevini başarmak zor görünüyor. Bununla ilgili, hiçbiri işe yarayan bir yanıt vermeyen 3 yığın aşımı sorusu vardır. İşte yapmaya çalıştığım şey. Satırların ve sütunların adlarının yanı sıra şeklini de zaten bildiğim bir DataFrame'im var. >>> df = pandas.DataFrame(columns=['a','b','c','d'], index=['x','y','z']) >>> df a b c …
133 python  dataframe  row  pandas 

5
Pandas DataFrame: bir sütundaki tüm değerleri duruma göre değiştirin
Aşağıdaki gibi basit bir DataFrame'im var: 'İlk Sezon' sütunundaki tüm değerleri seçmek ve 1990'dan büyük olanları 1 ile değiştirmek istiyorum. Bu örnekte, yalnızca Baltimore Kuzgunları 1996'yı 1 ile değiştirecektir (verilerin geri kalanını olduğu gibi koruyarak). Aşağıdakileri kullandım: df.loc[(df['First Season'] > 1990)] = 1 Ancak, yalnızca 'İlk Sezon' sütunundaki değerleri değil, …
132 python  pandas  dataframe 

13
Pandas veri çerçevesinde tüm sütunların adı nasıl gösterilir?
Yüzlerce sütundan oluşan bir veri çerçevem ​​var ve tüm sütun adlarını görmem gerekiyor. Ben ne yaptım: In[37]: data_all2.columns Çıktı: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) Kesilmiş bir liste yerine tüm sütunları nasıl …
131 python  pandas  dataframe  show 

8
Belirli NA sütununu içeren satırları çıkar
NABir veri çerçevesindeki değerleri nasıl atlayacağımı bilmek istiyorum , ancak yalnızca ilgilendiğim bazı sütunlarda. Örneğin, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) ancak sadece nerede yolduğu veriyi atlamak istiyorum NA, bu nedenle sonuç x y z 1 1 0 NA 2 2 …
130 r  dataframe  na 



5
R - İki veri çerçevesi birleştirilsin mi?
İki veri çerçevesi verildiğinde ave b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570 1.7916780 4 -1.3645337 1.3642276 5 -0.4954542 -0.6660001 …

10
R'de bir veri çerçevesine nasıl satır eklenebilir?
R'de, veri çerçevesi zaten başlatıldıktan sonra bir veri çerçevesine yeni bir satırı nasıl eklersiniz? Şimdiye kadar şuna sahibim: df <- data.frame("hi", "bye") names(df) <- c("hello", "goodbye") #I am trying to add "hola" and "ciao" as a new row de <- data.frame("hola", "ciao") merge(df, de) # Adds to the same row …
129 r  dataframe 

5
DataFrame'in bölümlenmesi nasıl tanımlanır?
Spark 1.4.0'da Spark SQL ve DataFrames kullanmaya başladım. Scala'da DataFrames üzerinde özel bir bölümleyici tanımlamak istiyorum, ancak bunun nasıl yapılacağını göremiyorum. Üzerinde çalıştığım veri tablolarından biri, aşağıdaki örneğe göre, hesaba göre, silimar işlemlerin bir listesini içeriyor. Account Date Type Amount 1001 2014-04-01 Purchase 100.00 1001 2014-04-01 Purchase 50.00 1001 2014-04-05 …

9
Spark DataFrame'e (PySpark kullanarak) nasıl yeni bir sütun eklerim?
Bir Spark DataFrame'im var (PySpark 1.5.1 kullanarak) ve yeni bir sütun eklemek istiyorum. Aşağıdakileri herhangi bir başarı olmadan denedim: type(randomed_hours) # => list # Create in Python and transform to RDD new_col = pd.DataFrame(randomed_hours, columns=['new_col']) spark_new_col = sqlContext.createDataFrame(new_col) my_df_spark.withColumn("hours", spark_new_col["new_col"]) Ayrıca bunu kullanırken bir hata var: my_df_spark.withColumn("hours", sc.parallelize(randomed_hours)) Peki PySpark …

4
Pandalar veri çerçevesi listesini birlikte birleştirin
Tek bir Pandas veri çerçevesinde birleştirmek istediğim Pandas veri çerçevesi listesi var. Python 2.7.10 ve Pandas 0.16.2 kullanıyorum Veri çerçevesi listesini şuradan oluşturdum: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall , cnxn, chunksize=10000): dfs.append(chunk) Bu, bir veri çerçevesi listesi döndürür …

3
Pandas GroupBy.agg () kullanılarak aynı sütunun birden çok toplamı
Birden çok kez çağrı yapmak zorunda kalmadan f1, f2aynı sütuna iki farklı toplama işlevini uygulamanın yerleşik bir yolu var mı?df["returns"]agg() Örnek veri çerçevesi: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 * np.random.randn(10), …

5
Pandalar veri çerçevesine eksik tarihleri ​​ekleyin
Verilerim belirli bir tarihte birden çok olay içerebilir veya bir tarihte olay YOK olabilir. Bu olayları alıyorum, tarihe göre sayıyorum ve planlıyorum. Ancak, onları çizdiğimde, iki serim her zaman eşleşmiyor. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() Yukarıdaki kodda idx , 30 tarih aralığı haline gelir. 09-01-2013 ila 09-30-2013 Ancak …
128 python  date  plot  pandas  dataframe 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.