Python'da iyi "sık sıralı madencilik" paketleri?


Yanıtlar:


6

Bulduğum tek şey: https://github.com/bartdag/pymining

onlar BIDEorada bir uygulama var ama kod korunmaz.

PS Sorunuza katılıyorum: - |


Sadece açıklığa kavuşturmak için, sık sık kapalı dizileri mayınlayan BIDE uygulamadı. Aslında tüm sık dizileri madenleyen PrefixSpan uyguladı. PrefixSpan ve BIDE aynı kalıp numaralandırma çerçevesini paylaşır ve bu nedenle yazarlar BIDE belgesinden alıntı yapmıştır.
Chuancong Gao

Sonunda ne yaptım kullanılır: philippe-fournier-viger.com/spmf - Bu bir JAVA lib ama ihtiyaçlarımı karşılamak için python ile
sardım

6

Python 3'te hem PrefixSpan hem de BIDE'nin etkin bir şekilde uygulanmasını sağlıyorum ve hem sık hem de üst-k (kapalı) sıralı paternlerin madenciliğini destekliyorum.

https://github.com/chuanconggao/PrefixSpan-py


Bunları javascript'te uygulamak istiyorum, ancak bu algoritmaların nasıl çalıştığını tam olarak anlamıyorum. Basit bir İngilizce açıklayabilir misiniz?
inf3rno

Orijinal minimal PrefixSpan uygulamasını kontrol etmenizi öneririm. Çekirdek kısmı sadece 15 satır alır. gist.github.com/chuanconggao/4df9c1b06fa7f3ed854d5d96e2ae499f
Chuancong Gao

Teşekkürler! Onu js'e çevirmeye çalışacağım, ama kolay olmayacak. :-) Afaik PrefixSpan, önekin eşleştiği yere göre öngörülen veritabanları oluşturuyor. Şu anda teori daha da iyi bir algoritma olan BIDE hakkında okuyorum.
inf3rno

Js ve python koleksiyonları arasında çok fazla fark var. Js kodu çoğaltmayı başaramadı. Daha sonra tekrar deneyeceğim.
inf3rno

Yardımcı olup olmadığından emin değilim, ancak PrefixSpan'ın başka bir Scala sürümüne sahibim. github.com/chuanconggao/PrefixSpan-scala Ancak, uygulamadan önce algoritmayı tamamen anlamanızı şiddetle tavsiye ederim.
Chuancong Gao

1

Kullandığım fim geçmişte 'ın fpgrowth fonksiyonunu ve iyi çalıştı. Ancak Windows makinelerine yüklemek biraz acı verici. Akademik bir web sitesi gibi görünüyor, bu yüzden zaman içinde kodda birçok güncelleme yapıp yapmadıklarından emin değilim ...


1

Kendi başınıza yazmayı düşündünüz mü? Çünkü şu anda muhtemelen güncel bir kütüphane yok.

Şuna bir bak, temel - PrefixSpan ve Kapalı / Maksimal kalıpları uygulamak o kadar da zor değil:

http://sequenceanalysis.github.io/



Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.