Hata dağılımı için Poisson, Gamma veya Tweedie dağılımlarını kullanarak Python / scikit-learn'daki GLM'yi değerlendirmek mümkün mü?


13

Bazı Python ve Sklearn öğrenmeye çalışıyorum, ancak çalışmalarım için Poisson, Gamma ve özellikle Tweedie ailelerinden hata dağılımlarını kullanan regresyonları çalıştırmam gerekiyor.

Onlarla ilgili belgelerde hiçbir şey görmüyorum, ancak R dağıtımının çeşitli kısımlarındalar, bu yüzden herhangi birinin Python için herhangi bir yerde uygulama görüp görmediğini merak ediyordum. Beni Tweedie dağıtımının SGD uygulamalarına yönlendirebilirseniz çok havalı olurdu!


Python'daki en sağlam GLM uygulamaları [statsmodels] statsmodels.sourceforge.net'tedir, ancak SGD uygulamaları olup olmadığından emin değilim.
Trey

Teşekkürler Trey. Görünüşe göre Tweedie için destek yok, ancak Poisson ve Gamma dağılımları hakkında biraz tartışıyorlar.
joe

Yanıtlar:


13

Scikit-öğrenmede Poisson, gama ve Tweedie hata dağılımları ile genelleştirilmiş doğrusal modeller uygulama hareketi vardır .

Statsmodels , Poisson, Tweedie ve gama hata dağılımları ile genelleştirilmiş doğrusal model uygulamalarına sahiptir.

Bu yanıtı güncellerken Spark ML de (deneysel olarak) Poisson, Tweedie ve gama dağılımlarını destekliyor.


5
Üzerinde çalışıyorum: github.com/madrury/py-glm
Matthew Drury

@MatthewDrury Harika!
Neal

@MatthewDrury güzel! GLM'leri kullanmaya yeni başladım ve istatistik modellerinin bazı sınırlamaları var. Matematiği tam olarak anladığımdan emin değilim, ancak iç çözümünüz keyfi en küçük kareler tipi bir çözücü ile değiştirilebilir mi? Bu esneklik ekleyeceğini düşünüyordum (örneğin sklearn.ElasticNet geçmek ölçeklenebilirlik / düzenli / vb almak için "ücretsiz"?).
GeoMatt22

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.