Bazı veri setlerinde stokastik eğim alçalması ile parametreli bir model (örn. Olasılığı en üst düzeye çıkarmak için) eğitilirken, eğitim örneklerinin eğitim veri dağıtımından alındığı yaygın olarak kabul edilir. Dolayısıyla, bir ortak dağıtım modellemekse , her bir eğitim örneği bu dağıtımdan çıkarılmalıdır.( x i , y i )
Amaç bunun yerine bir koşullu dağılım modellemekse, eğer iid şartı nasıl değişir?
- Ortak dağıtımdan her bir örneği yine mi çizmeliyiz?
- Biz çizmek mı gelen IID , daha sonra çizmek gelen IID ? P ( X ) y i
- dan iid değil çizebilir miyiz (örn. Zamanla ilişkili), sonra dan iid çizebilir ?
Stokastik degrade iniş için bu üç yaklaşımın geçerliliği hakkında yorum yapabilir misiniz? (Veya gerekirse soruyu yeniden söylememe yardımcı olun.)
Mümkünse # 3 yapmak istiyorum. Uygulamam takviye öğreniminde, burada kontrol politikası olarak parametreli bir koşullu model kullanıyorum. Devletlerin dizisi derece ilişkilidir, ancak eylemleri devlet şartına bir stokastik politikasından istatistiksel bağımsız örneklenir. Elde edilen örnekler (veya bunların bir alt kümesi), politikayı eğitmek için kullanılır. (Başka bir deyişle, bir ortamda uzun bir süre kontrol politikası uyguladığınızı, bir durum / eylem örnekleri veri kümesi topladığınızı düşünün. Daha sonra durumlar zamanla ilişkilendirilmiş olsa da, eylemler duruma göre bağımsız olarak üretilir.) Bu, bu makaledeki duruma biraz benzemektedir .
İlk başta alakalı görünen bir makale, Ryabko, 2006, " Koşullu Bağımsız Veri için Desen Tanıma "; ancak, durum ihtiyacım tersine çevrilir, burada (etiket / kategori / eylem) den değil çekilebilir ve (nesne / desen / durum) çizilir) .x i P ( X | Y )
Güncelleme: Ryabko gazetesinde bahsedilen iki makale ( burada ve burada ) burada alakalı görünmektedir. Onlar varsayalım (örneğin muhtemelen IID durağan olmayan verilmez) keyfi bir süreç geliyor. Bu durumda en yakın komşu ve çekirdek tahmincilerinin tutarlı olduğunu gösteriyorlar. Fakat ben bu durumda stokastik gradyan kökenli temelli tahminin geçerli olup olmadığı konusunda daha fazla ilgileniyorum.