Python'da Pandalar ve NumPy + SciPy arasındaki farklar nelerdir? [kapalı]


Yanıtlar:


314

pandalar NumPy üzerine inşa edilmiş üst düzey veri işleme araçları sağlar. NumPy, MATLAB'a benzer, oldukça düşük seviyeli bir araçtır. pandalar ise zengin zaman serisi işlevselliği, veri hizalama, NA dostu istatistikler, gruplama, birleştirme ve birleştirme yöntemleri ve daha birçok kolaylık sağlar. Son yıllarda finansal uygulamalarda çok popüler oldu. Gelecek kitabımda pandaları kullanarak finansal veri analizine ayrılmış bir bölümüm olacak.


217
Pandaların birincil yazarı olduğunuzu söylemelisiniz. :) Söz konusu kitap: shop.oreilly.com/product/0636920023784.do
Yktula

3
Pandacanın etkili sözlükler sunarken numpy'nin öncelikle etkili diziler sağladığını söylemek adil olur mu? (Her iki durumda da, serbest formdan ziyade tutarlı veri türüyle sınırlıdır.) Bana göre (şimdi şimdi bakmaya başlıyorum), bu altta yatan fark olarak dikkat çekiyor: etiketle eşleştirilmiş verilerin işlenmesi (1d aka dicts ve 2d aka tablolar). Bu nedenle veri hizalama, birleştirme vb. Mümkün olur , ancak bu temel farkı fark etmeyen insanlar için bunların ne anlama geldiği bile açık değildir (örneğin, iki numpy dizisinin "veri hizalaması" nedir?).
Brandyn

6
aptalca bir soru olabilir ama NA-friendly statisticscevabınızda bahsedilen ne demek istiyorsun .
Adil Abbasi

6
Bence, eksik veriler (NA, "Kullanılamaz") dikkate alınarak istatistiklere atıfta bulunur
user1319128

4
Soğuk iş parçacığı, ancak performans farklılıkları örneğin numpy'de karmaşık bir işlemdir, ancak pandalarda sözdizimsel olarak basitleştirilmiştir? Üst düzey, kolay sözdizimi yoluna gitmenin bir performans maliyeti var mı?
3pitt

59

Numpy, pandalar (ve Python için neredeyse tüm sayısal araçlar tarafından) gereklidir. Scipy, pandalar için kesinlikle gerekli değildir, ancak "isteğe bağlı bağımlılık" olarak listelenir. Pandaların Numpy ve / veya Scipy'e bir alternatif olduğunu söyleyemem. Daha ziyade, Python'daki sayısal ve tablo verileriyle daha akıcı bir çalışma yöntemi sağlayan ekstra bir araçtır. Panda veri yapılarını kullanabilir, ancak bunları manipüle etmek için Numpy ve Scipy işlevlerini özgürce kullanabilirsiniz.


4

Pandalar, binmeyi kolaylaştırabileceğiniz ( Python'daki pandalara bir veri çerçevesi binmek ) ve istatistikleri hesaplayabileceğiniz için tabloları manipüle etmek için harika bir yol sunar . Pandalarda harika olan bir diğer şey, farklı özelliklere sahip katman serilerine katılabileceğiniz ve groupby işlevini kullanarak birleştirebileceğiniz Panel sınıfıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.