EM algoritmasının birkaç açıklamasını okudum (örneğin, Bishop'un Örüntü Tanıma ve Makine Öğrenmesi'nden ve Roger ve Gerolami Makine Öğrenimi İlk Kursundan). EM'in türetilmesi tamam, anlıyorum. Ayrıca algoritmanın neden bir şeyi kapsadığını da anlıyorum: her adımda sonucu iyileştiririz ve olasılık 1.0 ile sınırlanır, bu nedenle basit bir gerçeği kullanarak (eğer bir fonksiyon artarsa ve o zaman birleşirse) algoritmanın yakınsadığını biliriz Bazı çözümler.
Ancak bunun yerel bir asgari olduğunu nasıl biliyoruz? Her adımda sadece bir koordinat (gizli değişken veya parametreler) düşünüyoruz, bu nedenle yerel minimumun her iki koordinatta aynı anda hareket etmesini gerektiren bir şeyi özleyebiliriz.
Bunun, EM'nin bir örneği olduğu genel tepe tırmanma algoritmaları sınıfına benzer bir sorun olduğuna inanıyorum. Yani genel bir tepe tırmanma algoritması için f (x, y) = x * y işlevi için bu problemimiz var. Eğer (0, 0) noktasından başlarsak, o zaman sadece aynı anda her iki yönü de göz önüne alarak 0 değerinden yukarı doğru hareket edebiliriz.