Bir seçenek, tüm ürün satın alma kombinasyonlarının frekanslarını elde etmektir; en yaygın kombinasyonları seçin; daha sonra her bireyin seçtiği kombinasyonu tahmin etmek için bir regresyon modeli oluşturun. Örneğin, bir ikili lojistik regresyon ile a) Beyaz Şarap, Brie, Çilek ve Üzümlere karşı b) Kırmızı Şarap, Cheddar ve Gouda'nın satın alınmasını akla getirebilirsiniz. Bu tür 2'den fazla kombinasyon ile veya "yukarıdakilerin hiçbiri" kategorisini dahil etmek istiyorsanız, çok terimli lojistik regresyon muhtemelen seçim yöntemi olacaktır.
Sadece ortak kombinasyonların dahil edilmesinin, her biri için daha uygulanabilir sayılara sahip olacağınız, ancak diğerlerini, en azından bu prosedürden hariç tutacağınız anlamına geldiğini unutmayın. Her biri en az birkaç kişi tarafından seçilen düzinelerce kombinasyon oluşturan 7 öğe hayal edebiliyorum. Bu muhtemelen örneklem büyüklüğünüz için çok fazla kategoridir. Dahası, bir kombo sadece birkaç kişi tarafından seçildiyse, modelinizin üzerinde çalışmak için çok az bilgi olurdu.
Diğer bir seçenek, birlikte satın alma eğiliminde olan birkaç öğeye ulaşmak için küme analizini kullanmaktır. 7 öğeyle, muhtemelen görevinizi kolaylaştırabilecek 4'ten az kümeyle sonuçlanacaksınız. Küme analizini denerseniz ve sonuçları işe yaramaz bulursanız, bunları kullanmanız için bir neden yoktur: sadece yukarıda açıklanan frekans tabanlı yaklaşıma geri dönün. Bu durumda, sizi doğru okursam, en açıklayıcı ve ilginç kategori dizisini arıyorsunuz ve bunu belirlerken, özgürlük dereceleri veya çoklu karşılaştırmalar veya geçerli olabilecek endişeler hakkında endişelenmenize gerek yok. bazı çıkarımsal testler yapmak için birden fazla yöntem deniyorsanız.