Eşdeğer veri var:
shopper_1 = ['beer', 'eggs', 'water',...]
shopper_2 = ['diapers', 'beer',...]
...
Ben benzer bir etkisi olurdu bir korelasyon matrisi elde etmek için bu veri seti üzerinde bazı analiz yapmak istiyorum: x satın aldıysanız, muhtemelen y satın alabilirsiniz.
Python (veya MATLAB dışında herhangi bir şey) kullanarak bunu nasıl yapabilirim? Bazı temel yönergeler veya nereye bakmam gerektiğini gösteren işaretler yardımcı olacaktır.
Teşekkür ederim,
Düzenleme - Öğrendiklerim:
Bu tür sorunlar ilişkilendirme kuralı keşfi olarak bilinir. Wikipedia'nın bazı yaygın algoritmaları kapsayan iyi bir makalesi var . Bunu yapmak için klasik algoritma, Agrawal ve ark. ark.
Bu beni bir python arayüzlü veri madenciliği paketi turuncuya götürdü. Linux için, onu kurmanın en iyi yolu, sağlanan setup.py dosyasını kullanarak kaynaktan gelmek gibi görünüyor.
Varsayılan olarak turuncu, desteklenen çeşitli yollardan biriyle biçimlendirilmiş dosyalardan gelen girdileri okur.
Son olarak, basit bir Apriori dernek kuralı öğrenme turuncu renkte basittir .
arules
bir göz atmaya değer. Belki de "ilişkilendirme kuralları" iyi bir arama terimidir