Mark van der Laan'ın makalelerini anlamaya çalışıyorum. Berkeley'de makine öğrenimi ile büyük ölçüde örtüşen problemler üzerinde çalışan teorik bir istatistikçi. Benim için bir problem (derin matematiğin yanı sıra) genellikle tamamen farklı bir terminoloji kullanarak tanıdık makine öğrenme yaklaşımlarını tanımlamasıdır. Temel kavramlarından biri "Hedeflenen Maksimum Olabilirlik Beklentisi" dir.
TMLE, kontrolsüz bir deneyden sansürlenen gözlemsel verileri, kafa karıştırıcı faktörlerin varlığında bile etki tahminine izin verecek şekilde analiz etmek için kullanılır. Aynı kavramların çoğunun diğer alanlardaki diğer isimler altında bulunduğundan şüpheleniyorum, ancak bunu doğrudan herhangi bir şeyle eşleştirecek kadar iyi anlamıyorum.
"Hesaplamalı Veri Analizi" konusundaki boşluğu kapatmaya yönelik bir girişim burada:
Veri Bilimi Çağına Girmek: Hedefli Öğrenme ve İstatistik ve Hesaplamalı Veri Analizinin Entegrasyonu
Ve istatistikçiler için bir giriş burada:
Hedeflenen Maksimum Olabilirliğe Dayalı Nedensel Çıkarım: Bölüm I
İkincisi:
Bu yazıda, çoklu zaman noktası müdahalelerinin nedensel etkilerinin belirli bir hedefli maksimum olabilirlik tahmin edicisini geliştiriyoruz. Bu, G-hesaplama formülünün bilinmeyen faktörlerinin ilk tahminini elde etmek ve daha sonra, her bir tahmini faktöre bir hedef parametreye özgü optimal dalgalanma fonksiyonu (en az uygun parametrik alt model) uygulamak için kayıp temelli süper öğrenmenin kullanımını içerir, dalgalanma parametrelerini maksimum olasılık tahmini ile tahmin etmek ve yakınsamaya kadar başlangıç faktörünün bu güncelleme adımını tekrarlamak. Bu yinelemeli hedeflenmiş maksimum olabilirlik güncelleme adımı, ilk tahmin edicinin tutarlı olması durumunda tutarlı olması açısından nedensel etkinin sonuç tahmin edicisini iki kat daha sağlam kılar, veya optimal dalgalanma fonksiyonunun tahmincisi tutarlıdır. Nedensel grafikteki düğümlerin koşullu dağılımları, üzerine müdahale edildiği takdirde, optimum dalgalanma fonksiyonu doğru bir şekilde belirtilir.
Terminolojisinde "süper öğrenme", teorik olarak sağlam, negatif olmayan bir ağırlık şeması ile topluluk öğrenmesidir. Ancak, "her bir tahmini faktöre bir hedef parametreye özgü optimal dalgalanma fonksiyonu (en az uygun parametrik alt model) uygulanarak" ne anlama gelir?
Ya da üç ayrı soruya bölünerek, TMLE'nin makine öğreniminde bir paraleli var mı, "en az uygun parametrik alt model" nedir ve diğer alanlarda "dalgalanma fonksiyonu" nedir?