Geliri en üst düzeye çıkarmak için dinamik bir fiyatlandırma sorunu üzerinde çalışan tek bir aracı için zaten işleyen bir uygulamam var. Bununla birlikte çalıştığım sorun, birbirlerinin yerini alan birkaç farklı ürünü içeriyor, bu yüzden hepsini bağımsız öğrencilerle dinamik olarak fiyatlandırmak yanlış görünüyor, çünkü birinin fiyatı diğerinin ödülünü etkiliyor. Amaç, her bir gelirin toplamını en üst düzeye çıkarmak için hepsini dinamik olarak fiyatlandırmak olacaktır.
Bu şekilde takviye öğrenimini uygulayan bir şey bulmaya çalışmak için biraz araştırma yapıyorum, ancak bulduğum birçok çok ajanlı uygulama kooperatiften daha rekabetçi oyunlara odaklanıyor ya da diğer ajanların eksik bilgisini varsayarlar (tam olurdu bu senaryodaki her temsilcinin bilgisi). Bu şekilde işbirlikli öğrenmenin iyi araştırılmış / belgelenmiş uygulamaları var mı?