Lisansüstü istatistik kursu tarafından sunulan düzeyde istatistikler için açık kaynaklı Java kütüphanesi


15

Uygulamalı İstatistik alanında aşağıdaki ders kitabını kullanan bir yüksek lisans dersi alıyorum (size kapsanan materyalin düzeyi hakkında fikir vermek için): GK Bhattacharyya ve RA Johnson tarafından sunulan İstatistiksel Kavramlar ve Yöntemler .

Profesör ödevler için SAS kullanmamızı istiyor.

Sorum şu: bu tür sınıflarda genellikle görülen sorunlar için SAS yerine kullanılabilecek bir Java kütüphanesi (leri) var mı?

Şu anda Apache Math Commons ile yapmaya çalışıyorum ve kütüphaneden etkilendiğim halde (kullanım kolaylığı ve anlaşılabilirlik) histogram çizme (bir grafik kütüphanesiyle birleştirmeyi düşünme gibi) bile basit şeylerden yoksun görünüyor. ).

Colt'a baktım, ancak ilk ilgim oldukça hızlı bir şekilde azaldı.

Herhangi bir girişi takdir ediyorum - ve Stackoverflow benzer sorulara baktım ama çekici bir şey bulamadım.

NOT: Onlara çağrı yapan R, SciPy ve Octave ve java kütüphanelerinin farkındayım - birlikte aradığım özellikleri sağlayabilen bir Java yerel kütüphanesi veya kütüphaneler seti arıyorum.

NOT: Böyle bir sınıfta ele alınan konular tipik olarak şunları içerir: tek örnek ve iki örnek testleri ve ortalamalar ve medyanlar için güven aralıkları, tanımlayıcı istatistikler, uyum iyiliği testleri, tek ve iki yönlü ANOVA, eşzamanlı çıkarım, test varyanslar, regresyon analizi ve kategorik veri analizi.


2
R'yi düşündün mü ?
RioRaider

Merhaba, not için teşekkürler, neredeyse tamamen Java'da bir kütüphane arıyorum. Bu yüzden onları arayan R, SciPy ve Octave ve java kütüphanelerinin farkındayım - bunu yansıtmak için soruyu düzenleyeceğim. Teşekkürler.
user1172468 18:12

"Onlara çağrı yapan R, SciPy ve Octave ve java kütüphanelerinin farkındayım" demiştiniz. Java kullanarak "R istatistik yazılımı" ile yazılan kodu nasıl arayacağınızı söyleyebilir misiniz?
Aman Chawla

5
Temel istatistik testleri için neden bir Java kitaplığı kullanmak istiyorsunuz?
Underminer

3
@Ulderminer burada doğru soruyu sorar. Java'da istatistik yapmak, vidalar için çekiç kullanmak gibidir. Yeterli kararlılık ve kaba kuvvetle vidayı yerine yerleştirebilirsiniz, ancak çok zarif veya verimli bir şekilde alamazsınız. Muhtemelen hasarlı bir vida ve ağrılı parmaklarla sonuçlanacaksınız.
Marc Claesen

Yanıtlar:


10

Temel istatistikler için java kullanmak zorunda kaldığımda, apache commons math gidilecek yoldur. Grafikler için JFreeChart kullanıyorum ve tavsiye ediyorum . İkincisi yaygın olarak yayılmıştır, bu nedenle stackoverflow'un bunun için doldurulmuş bir etiketi vardır .

Düzenle

Biri bir süit ararsa , belki de Deducer bir seçenektir. GUI JGR'ye dayanmaktadır, bu arada istatistiksel parçalar R'de çağrılmaktadır. Hem R hem de java yoluyla genişletilebilir gibi görünüyor . Örneğin, Rengine çağrılarını atlayabilir, bunun yerine başvurulan java kütüphanelerini arayabilirsiniz. Ama itiraf ediyorum, henüz denemedim.

OP'yi anladığım kadarıyla, Rapidminer, GUI erişimini (görselleştirmeler dahil), kütüphane ve özel eklenti geliştirmeyi destekleyen saf bir java çerçevesi olduğundan , optimum, İstatistikler için Rapidminer gibi bir şey olacaktır . Bildiğim kadarıyla istatistik için böyle bir şey mevcut değil. Ben do tavsiye RapidMiner o belirli görev için çünkü sadece en temel istatistiksel testleri içermektedir benim bildiğimiz kadarıyla. Görselleştirmeler son zamanlarda genişletildi, ancak şimdi ne kadar özelleştirilebilir olduklarını tahmin edemiyorum.


Merhaba, yapmaya çalıştığım şey bu, daha kapsamlı bir süit olsaydı.
user1172468 18:12

@ user1172468 Cevabımı güncelledim
steffen

4

Suan Shu: NumericalMethod.com adresini ziyaret edin . Genel olarak ücretsiz değildir, ancak akademik kullanım için ücretsizdir.


Bu gerçekten OP'nin sorusuna bir cevap değil. Daha çok bir yorum. Cevabı daha iyi hale getirmek için genişletmek ister misiniz? Alternatif olarak, sizin için bir yoruma dönüştürebiliriz.
gung - Monica'yı eski

Belki de bunun neden bir cevap olmadığını genişletebilirsiniz. Bir java kütüphanesi arıyor ve onu, aradığı özelliklerin çoğuna sahip bir kütüphaneye yönlendirdim.
user765195

Haklısın, bu durum standart durumdan biraz daha belirsiz. Bununla birlikte, bu aslında sadece bir bağlantıdır. SE bunları cevaplardan ziyade yorum olarak düşünüyor. Bunu bir yorum olarak belirtmek için yeterince itibarınız var. Sadece bir link burada bir çeşit cevap olduğu için ve bir oy kullandığı için, bir yoruma dönüştürmek için işaretlemedim, ancak biraz ekleyebilmeniz hoş olabilir. Yapamazsanız ve yorum yapmamayı seçerseniz, kararınıza saygı duyuyorum, bu yüzden size sadece bir not bıraktım.
gung - Monica'yı eski

Akademik kullanım için ücretsiz görünmüyor.
kosmos

Ne yazık ki, artık görünüşe göre değil, ama bir öğrenci sürümü hala 100 $ için kullanılabilir görünüyor.
user765195

3

Benzer Steffen önerisi RapidMiner, sen düşünebilirsiniz Weka . Makine öğrenimine, umduğunuzdan daha özel bir şekilde yönelik olabilir. Kümeleme, sınıflandırma ve regresyon gibi görevler için birçok algoritma vardır. Weka'nın bir GUI'si vardır, ancak aynı zamanda bir yazılım kütüphanesi olarak da kullanılabilir. GUI'de histogramlar gördüm, ancak bunları kütüphaneden tekrar kullanmanın kolay olup olmadığından emin değilim.


Merhaba yanıt için teşekkürler, gerçekten bir Grad İstatistik kursunda kapsanan malzeme düşünüyordum: Konular bir ve iki örnek testleri ve araç ve medyanlar için güven aralıkları, tanımlayıcı istatistikler, uygunluk testleri, bir ve iki içerir yönlü ANOVA, eşzamanlı çıkarım, test varyansları, regresyon analizi ve kategorik veri analizi.
user1172468

1

Http://www.roguewave.com/Portals/0/products/imsl-numerical-libraries/java-library/docs/5.0.1/api/overview-summary.html adresini deneyin.

İyi belgelenmiştir ve birçok yararlı istatistiksel ve matematiksel fonksiyon sağlar. Ancak ne yazık ki açık kaynak değildir. Bu sizi rahatsız etmiyorsa, kütüphane iyi olmalıdır.

Ancak, grafik çıktı sağlarsa bilmiyorum.


1
Merhaba, bağlantı için teşekkürler, Apache Commons Math ile nasıl karşılaştırıldığını biliyor musunuz?
user1172468 18:12

1

DataMelt bilgi işlem ortamında neredeyse her konu için birçok Java istatistik kütüphanesi bulunur. Web sitesinde savunulan Jython kullanarak kullanabilirsiniz, ancak Java ve Groovy ile kullanıyorum.

Daha fazlasını söyleyebilirim: DataMelt projesi aşağıdaki istatistiksel konuları kapsamaktadır:

  • Rastgele sayılar
  • En popüler kesikli ve sürekli dağılımlar
  • Betimsel istatistiksel analiz
  • Veri uyumu (doğrusal ve doğrusal olmayan)
  • Çeşitli istatistiksel testler
  • 2D ve 3D histogramlar

Hatalı verilere uymak için günlük olabilirlik yaklaşımını kullanan doğrusal olmayan bir regresyon örneği:

resim açıklamasını buraya girin

Paket ücretsizdir.


3
Siteye hoş geldiniz, @Remi. Bu gerçekten OP'nin sorusuna bir cevap değil. Daha çok bir yorum. Lütfen cevap vermek için yalnızca "Yanıtınız" alanını kullanın. Sinir bozucu olduğunu biliyorum, ancak itibarınız> 50 olduğunda herhangi bir yere yorum yapabileceksiniz. Alternatif olarak, daha fazla yanıt almak için genişletmeye çalışabilirsiniz. Burada yeni olduğunuz için yeni kullanıcılar için bilgiler içeren tur sayfamızı okumak isteyebilirsiniz .
gung - Monica'yı eski
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.