Kullanıcının Amazon'daki satın alma davranışını nasıl modelleyebilirim?


9

Veri Bilimi alanındaki son kurs projemiz için şunları önerdik:

Amazon Reviews Veri Kümesi'ni verin, Amazon'a reklam yerleştirmek için stratejik bir konum belirleyen bir algoritma (kabaca Kişiselleştirilmiş PageRank tabanlı) bulmayı planlıyoruz. Örneğin, Amazon'da milyonlarca ürün var. Ve veri seti size hangi ürünlerin ilişkili olduğu, hangi ürünlerin bir araya getirildiği, bir araya getirildiği vb. Hakkında bir fikir verir. 14 yıl. Tüm bu bilgileri kullanarak ürünleri Amazon'da derecelendiririz / sıralarız. Artık Amazon'da, ürün sayfalarına yönelik trafiği iyileştirmek isteyen bir tedarikçisiniz. Algoritmamız, maksimum trafik elde edebilmeniz için grafikte reklamınızı yerleştirebileceğiniz stratejik konumları belirlemenize yardımcı olur.

Şimdi, Profesörümüzün sorusu, algoritmanızı gerçek kullanıcılar olmadan nasıl doğrulayacaksınız? Dedik-

Sabit bir kullanıcı setini modelleyebiliriz. Bazı kullanıcılar , üçüncü atlamadan birinci veya beşinci atlamadan daha sık takip eder also_boughtve also_viewedbağlantı kurar. Orada kullanıcıların davranışı normal olarak dağıtılır. Diğer bazı kullanıcılar ilk sekmenin ötesine geçemez. Bu kullanıcı davranışı kümesi katlanarak dağıtılır.

Profesörümüz dedi ki - Kullanıcılar ne şekilde takip ederlerse etsinler, kullanıcılar benzer ürünler için bağlantılar kullanarak geziniyorlar. Sıralama algoritmanız, b / w 2 ürünlerinin sıralı ürünlerle benzerliğini de göz önünde bulundurur. Yani bu doğrulama algoritmasını kullanmak biraz cheating. Algoritmaya daha gerçekçi ve dikey olan başka bir kullanıcı davranışı ile gelin.

Kullanıcıların davranışlarını modelleme konusunda herhangi bir fikriniz var mı? Algo hakkında daha fazla bilgi vermekten mutluluk duyuyorum.

Yanıtlar:


1

Algoritmanızı nasıl doğrulayacaksınız?

İkinci soruya cevap vermeye çalışmak yerine, ilk soruya verdiğiniz cevabın revizyona ihtiyaç duyabileceğini düşünün ...

Veri bilimi sınıfınız boyunca öğrenme yöntemlerini doğrulamak için hangi yöntemleri kullandınız? İlk olarak, modelinizin başarısını veya başarısızlığını değerlendirmek için belirli bir sayısal metrikler kümesi tanımlamak istiyorsunuz . İkincisi, çok gerçekçi bir test popülasyonu oluşturmak için hangi yöntemleri kullanabilirsiniz (popülasyonu modellemekten daha gerçekçi)? Vereceğim ilk ipucu, Amazon Reviews Veri Kümesinin çok büyük olması, bu nedenle verilerinizin bu yönteme çok uygun olmasıdır. Vereceğim ikinci ipucu, bu yöntemin muhtemelen sınıfta üzerinde çalıştığınız denetimli öğrenme sorunlarının% 95'inde kullandığınız yöntem olduğu ...

Umarım bu yardımcı olur ... OP tarafından eklenen yorumlara dayanarak bunu düzenleyeceğim, ancak bazı organik düşünceleri ortaya çıkarmak için hemen çözüm sağlamak istemiyorum, çünkü bu bir sınıf problemi ve Prof Ayrıca kendi kendinize doğru çözümü bulmanıza yardımcı olmaya çalışıyoruz.


0

Kullanmanız gereken davranış modeli için iki gereklilik vardır: (1) "daha gerçekçi" ve (2) algoritmanıza dikey.

(1) Gerçekçi olarak, davranışın Amazon satın alımlarının belirli bağlamından daha geniş bağlamlarda gözlemlenen davranışları yansıtması gerektiğini varsayalım.

(2) Ortogonal anlaşılması daha kolaydır. Modellenen davranış, ürünler arasındaki benzerliklerden kaynaklanmamalıdır.

Bu iki şartı yerine getirmek için basit bir yaklaşım, satın alma davranışlarının cinsiyet, yaş, yer (örneğin kentsel alan / kırsal) ve ekonomik kısıtlamalar (gelir ve fiyat) gibi sosyo-demografik özelliklerden kaynaklanmasıdır.

Bir kullanıcı grubunuz ve bir ürün grubunuz var. Sosyo-demografik değişkenler ile ürün talebi arasındaki ilişkiyi basit ama dikkatli regresyon tekniklerini kullanarak tahmin edebilirsiniz. Gerekirse, gelir gibi önemli eksik değişkenlerle ilgili varsayımlar yapmak için harici veri kaynaklarını kullanabilirsiniz.

O zaman bir satıcıysanız, sosyo-demografik model hangi grupların ürününüzü satın alacağını tahmin eder.

Umarım bu yardımcı olur :)

Ben

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.