Veri Bilimi alanındaki son kurs projemiz için şunları önerdik:
Amazon Reviews Veri Kümesi'ni verin, Amazon'a reklam yerleştirmek için stratejik bir konum belirleyen bir algoritma (kabaca Kişiselleştirilmiş PageRank tabanlı) bulmayı planlıyoruz. Örneğin, Amazon'da milyonlarca ürün var. Ve veri seti size hangi ürünlerin ilişkili olduğu, hangi ürünlerin bir araya getirildiği, bir araya getirildiği vb. Hakkında bir fikir verir. 14 yıl. Tüm bu bilgileri kullanarak ürünleri Amazon'da derecelendiririz / sıralarız. Artık Amazon'da, ürün sayfalarına yönelik trafiği iyileştirmek isteyen bir tedarikçisiniz. Algoritmamız, maksimum trafik elde edebilmeniz için grafikte reklamınızı yerleştirebileceğiniz stratejik konumları belirlemenize yardımcı olur.
Şimdi, Profesörümüzün sorusu, algoritmanızı gerçek kullanıcılar olmadan nasıl doğrulayacaksınız? Dedik-
Sabit bir kullanıcı setini modelleyebiliriz. Bazı kullanıcılar , üçüncü atlamadan birinci veya beşinci atlamadan daha sık takip eder
also_bought
vealso_viewed
bağlantı kurar. Orada kullanıcıların davranışı normal olarak dağıtılır. Diğer bazı kullanıcılar ilk sekmenin ötesine geçemez. Bu kullanıcı davranışı kümesi katlanarak dağıtılır.
Profesörümüz dedi ki - Kullanıcılar ne şekilde takip ederlerse etsinler, kullanıcılar benzer ürünler için bağlantılar kullanarak geziniyorlar. Sıralama algoritmanız, b / w 2 ürünlerinin sıralı ürünlerle benzerliğini de göz önünde bulundurur. Yani bu doğrulama algoritmasını kullanmak biraz cheating
. Algoritmaya daha gerçekçi ve dikey olan başka bir kullanıcı davranışı ile gelin.
Kullanıcıların davranışlarını modelleme konusunda herhangi bir fikriniz var mı? Algo hakkında daha fazla bilgi vermekten mutluluk duyuyorum.