«dataframe» etiketlenmiş sorular

Veri çerçevesi tablo şeklinde bir veri yapısıdır. Genellikle, satırların gözlem olduğu ve sütunların çeşitli türlerde değişkenler olduğu veriler içerir. "Veri çerçevesi" veya "veri çerçevesi" bu kavram için birçok dilde kullanılan terim olsa da (R, Apache Spark, deedle, Maple, Python'daki panda kütüphanesi ve Julia'daki DataFrames kütüphanesi), "tablo" MATLAB ve SQL.


10
Pandalar'da harita, uygulama haritası ve uygulama yöntemleri arasındaki fark
Bu vektörleştirme yöntemlerini ne zaman kullanacağımı temel örneklerle söyleyebilir misiniz? Bunun mapbir Seriesyöntem olduğunu , geri kalanı ise yöntem olduğunu görüyorum DataFrame. Ama kafam karıştı applyve applymapyöntemler. DataFrame'e bir işlev uygulamak için neden iki yöntemimiz var? Yine, kullanımı gösteren basit örnekler harika olurdu!



5
Boş bir Panda DataFrame oluşturma, sonra doldurma?
Buradaki pandalar DataFrame belgelerinden başlıyorum: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Yinelenen DataFrame bir zaman serisi tür hesaplama değerleri ile doldurmak istiyorum. Temel olarak, DataFrame'i A, B sütunları ve zaman damgası satırları, tümü 0 veya tümü NaN ile başlatmak istiyorum. Daha sonra başlangıç ​​değerleri ekler ve bu veriyi, önceki satırdan yeni satırı hesaplayarak söylerdim row[A][t] …
463 python  dataframe  pandas 



11
Panda DataFrame'den kısmi dize ile seçim
Ben DataFrame4 sütun 2 olan dize değerleri içeren var. Belirli bir sütuna karşı kısmi bir dize maç dayalı satır seçmek için bir yol olup olmadığını merak ediyordum? Başka bir deyişle, böyle bir şey yapacak bir işlev veya lambda işlevi re.search(pattern, cell_in_question) bir boole döndürüyor. Ben sözdizimi aşina df[df['A'] == "hello …


7
Pandalar GroupBy kullanarak her grup için istatistik (sayım, ortalama, vb.) Alın?
Bir veri çerçevesi var dfve ondan birkaç sütun kullanın groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Yukarıdaki şekilde neredeyse ihtiyacım olan tabloyu (veri çerçevesi) alıyorum. Eksik olan, her gruptaki satır sayısını içeren ek bir sütundur. Başka bir deyişle, demek istediğim ama aynı zamanda bu araçları elde etmek için kaç tane sayı kullanıldığını da bilmek istiyorum. …

7
Pandas veri çerçevesini SQL'de olduğu gibi 'in' ve 'not in' kullanarak nasıl filtreleyebilirim?
Nasıl SQL en karşılıkları elde edebilirsiniz INve NOT IN? Gerekli değerleri içeren bir listem var. İşte senaryo: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Şu anki bunu yapmam şu şekildedir: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT IN not_in = …

18
Python ile Pandalar'da CSV dosyasını okurken UnicodeDecodeError
30.000 benzer dosyayı işleyen bir program çalıştırıyorum. Rastgele sayıda kişi bu hatayı durduruyor ve üretiyor ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, in read ret …

15
Birden fazla csv dosyasını pandalara aktarın ve bir DataFrame'e birleştirin
Bir dizinden pandalara birkaç csv dosyası okumak ve bunları büyük bir DataFrame'e birleştirmek istiyorum. Yine de anlayamadım. Şimdiye kadar sahip olduğum şey: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") dfs = [] for filename in filenames: dfs.append(pd.read_csv(filename)) # Concatenate …

16
Veri çerçevesinin sütun adlarını değiştirme
"Newprice" adında bir veri çerçevem ​​var (aşağıya bakın) ve R'deki programımdaki sütun adlarını değiştirmek istiyorum. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 Aslında ben de bunu yapıyorum: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Ben her döngü adı gördüğünüz gibi farklı olmasını istiyorum çünkü …
399 r  dataframe  rename 

6
Tam sayı dizinine göre bir dizi panda serisi / veri çerçevesi seçme
Ben neden olarak merak ediyorum df[2]iken, desteklenmez df.ix[2]ve df[2:3]her iki çalışma. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Ben beklenebilir df[2]aynı şekilde çalışması için df[2:3]Python indeksleme kongre ile tutarlı …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.