“Hedeflenen Maksimum Olabilirlik Beklentisi” nedir?


15

Mark van der Laan'ın makalelerini anlamaya çalışıyorum. Berkeley'de makine öğrenimi ile büyük ölçüde örtüşen problemler üzerinde çalışan teorik bir istatistikçi. Benim için bir problem (derin matematiğin yanı sıra) genellikle tamamen farklı bir terminoloji kullanarak tanıdık makine öğrenme yaklaşımlarını tanımlamasıdır. Temel kavramlarından biri "Hedeflenen Maksimum Olabilirlik Beklentisi" dir.

TMLE, kontrolsüz bir deneyden sansürlenen gözlemsel verileri, kafa karıştırıcı faktörlerin varlığında bile etki tahminine izin verecek şekilde analiz etmek için kullanılır. Aynı kavramların çoğunun diğer alanlardaki diğer isimler altında bulunduğundan şüpheleniyorum, ancak bunu doğrudan herhangi bir şeyle eşleştirecek kadar iyi anlamıyorum.

"Hesaplamalı Veri Analizi" konusundaki boşluğu kapatmaya yönelik bir girişim burada:

Veri Bilimi Çağına Girmek: Hedefli Öğrenme ve İstatistik ve Hesaplamalı Veri Analizinin Entegrasyonu

Ve istatistikçiler için bir giriş burada:

Hedeflenen Maksimum Olabilirliğe Dayalı Nedensel Çıkarım: Bölüm I

İkincisi:

Bu yazıda, çoklu zaman noktası müdahalelerinin nedensel etkilerinin belirli bir hedefli maksimum olabilirlik tahmin edicisini geliştiriyoruz. Bu, G-hesaplama formülünün bilinmeyen faktörlerinin ilk tahminini elde etmek ve daha sonra, her bir tahmini faktöre bir hedef parametreye özgü optimal dalgalanma fonksiyonu (en az uygun parametrik alt model) uygulamak için kayıp temelli süper öğrenmenin kullanımını içerir, dalgalanma parametrelerini maksimum olasılık tahmini ile tahmin etmek ve yakınsamaya kadar başlangıç ​​faktörünün bu güncelleme adımını tekrarlamak. Bu yinelemeli hedeflenmiş maksimum olabilirlik güncelleme adımı, ilk tahmin edicinin tutarlı olması durumunda tutarlı olması açısından nedensel etkinin sonuç tahmin edicisini iki kat daha sağlam kılar, veya optimal dalgalanma fonksiyonunun tahmincisi tutarlıdır. Nedensel grafikteki düğümlerin koşullu dağılımları, üzerine müdahale edildiği takdirde, optimum dalgalanma fonksiyonu doğru bir şekilde belirtilir.

Terminolojisinde "süper öğrenme", teorik olarak sağlam, negatif olmayan bir ağırlık şeması ile topluluk öğrenmesidir. Ancak, "her bir tahmini faktöre bir hedef parametreye özgü optimal dalgalanma fonksiyonu (en az uygun parametrik alt model) uygulanarak" ne anlama gelir?

Ya da üç ayrı soruya bölünerek, TMLE'nin makine öğreniminde bir paraleli var mı, "en az uygun parametrik alt model" nedir ve diğer alanlarda "dalgalanma fonksiyonu" nedir?


1
Terminolojinin yabancı olmasının bir nedeni, TMLE'nin amacının tahmini değil ortalama tedavi etkisini - nedensel çıkarım - tahmin etmektir. TMLE ile ilgili makalelerde "süper öğrenen" i okuduğumda, yazarların terimi topluluk modelleri oluşturmak için R'deki SuperLearner paketinden ödünç aldıklarını düşündüm.
RobertF

Yanıtlar:


24

Van der Laan'ın zaten var olan fikirler için yeni isimler oluşturma eğiliminde olduğunu kabul ediyorum (örneğin süper öğrenen), ancak TMLE bildiğim kadarıyla bunlardan biri değil. Aslında çok zekice bir fikir ve Machine Learning topluluğundan benzer görünen hiçbir şey görmedim (ancak cahil de olabilirim). Fikirler, yarı istatistiki-verimli tahmin denklemleri teorisinden geliyor, ki bu istatistikçilerin ML insanlarından çok daha fazla düşündüklerini düşünüyorum.

P0 Ψ(P0)

iφ(Yiθ)=0,

θ=θ(P)PΨφEPφ(Yθ)=0θP0Ψ(P0)(Not: Sadece sezgisel olarak tanımladığım için "verimli" terimi ile biraz gevşek oluyorum.) Bu tür tahmin denklemlerinin arkasındaki teori oldukça zariftir, bu kitap kanonik referanstır. Burası "en az uygun alt modellerin" standart tanımlarını bulabilir; bunlar van der Laan'ın icat ettiği terimler değil.

P0P0Ψ(P0)P0P^Ψ(P^)nP0Ψ

p^

p^1,ϵ=p^exp(ϵ φ(Yθ))p^exp(ϵ φ(yθ)) dy

ϵϵϵ=0p^Ψϵ0p^1p^

p^2,ϵp^1,ϵ^exp(ϵ φ(Yθ).

ve böylece etkili tahmin denklemini sağlayan bir şey elde edene kadar.


1
"Van der Laan'ın zaten var olan fikirler için yeni isimler icat etme eğilimi olduğunu kabul ediyorum" - Evet, TMLE'nin şu tanıtımına bakın: biostats.bepress.com/ucbbiostat/paper252 , burada van der Laan "rastgele rastgele" kullanıyor değişebilirlik ve "deneysel tedavi ataması (ETA) varsayımı" anlamına gelir. :-) Alanımızda çok sıradışı değil. Veri bilimcileri, üniversitede duyarlılık, pozitif tahmin değeri ve hipotez testi olarak öğrendiğim hatırlama, kesinlik ve A / B testi gibi terimler kullanmaktadır.
RobertF

2
@RobertF CAR, Heitjan ve Rubin'den kaynaklanmaktadır ve MAR'nın genellemesidir. Rubin MAR'yı icat etti ve potansiyel sonuçlar çerçevesini popülerleştirdi, bu nedenle CAR'ı cahillik / değiştirilebilirlik tipi varsayımlar için bir yakalama olarak kullanmak benim için adil görünüyor.
adam
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.