IMHO, makine öğrenimini ve istatistiklerini verilere uygun temel model seviyelerinde ayıran resmi bir fark yoktur. Modellerin seçiminde, modellerin verilere uydurma hedeflerinde ve bazılarında yorumları genişletmede kültürel farklılıklar olabilir.
Tipik örneklerde her zaman sahip olduğumuzu düşünebilirim
- modellerin bir koleksiyon için i ∈ I bazı indeks set için I ,Mbeni ∈ Iben
- ve her biri için bir bilinmeyen bileşen θ i modeli (parametreler, sonsuz boyutlu olabilir) M i .benθbenMben
Montaj verilere hemen hemen her zaman bilinmeyen bileşenin optimum seçimi bulma oluşan matematiksel optimizasyon problemidir θ i yapmak için M i bazı favori fonksiyonu ile ölçülen verileri uygun.MbenθbenMben
Modeller arasında seçim az standarttır ve mevcut bir dizi teknik bulunmaktadır. Model takma işleminin amacı tamamen öngörücü ise, model seçimi iyi bir tahmin performansı elde etmek için yapılır, oysa temel amaç ortaya çıkan modelleri yorumlamaksa, diğer modellere göre daha kolay yorumlanabilen modeller seçilebilir. Tahmini gücün daha kötü olması bekleniyor.Mben
Eski okul istatistik modeli seçimi olarak adlandırılabilecek şey, belki de adım adım seçim stratejileriyle birleştirilen istatistiksel testlere dayanırken, makine öğrenme modeli seçimi genellikle, genellikle çapraz doğrulama kullanılarak tahmin edilen beklenen genelleme hatasına odaklanır. Bununla birlikte, model seçimindeki mevcut gelişmeler ve anlayışlar, daha yaygın bir zemine yakınlaşıyor gibi görünmektedir, örneğin, bkz . Model Seçimi ve Model Ortalaması .
Modellerden nedensellik çıkarımı
Maddenin konusu, bir modeli nasıl yorumlayabileceğimizdir? Elde edilen veriler dikkatlice tasarlanmış bir deneyden geliyorsa ve model yeterliyse, modeldeki bir değişkenin değişiminin nedensel bir etki olarak yorumlanması ve deneyi tekrarlayıp bu değişkene müdahale edersek mümkün olabilir. tahmini etkiyi gözlemlemeyi bekleyebiliriz. Bununla birlikte, veriler gözlemsel ise, modeldeki tahmini etkilerin gözlemlenebilir müdahale etkilerine karşılık gelmesini bekleyemeyiz. Bu, modelin bir "makine öğrenme modeli" veya "klasik istatistiksel model" olup olmadığına bakılmaksızın ek varsayımlar gerektirecektir.
Tek değişkenli parametre tahminlerine ve etki büyüklüğü yorumlarına odaklanan klasik istatistiksel modelleri kullanma konusunda eğitim almış insanlar olabilir, nedensel bir yorumlamanın bu çerçevede makine öğrenim çerçevesinden daha geçerli olduğu izlenimini uyandırıyor olabilirler. Öyle olmadığını söyleyebilirim.
İstatistiklerdeki nedensel çıkarım alanı sorunu gerçekten ortadan kaldırmaz, ancak nedensel sonuçların açık olduğu varsayımlarını yapar. Bunlar denenemez varsayımlar olarak adlandırılır . Makale İstatistikte nedensel çıkarım: Judea Pearl'ün genel bakış okuması iyi bir makaledir. Nedensel çıkarımdan gelen büyük bir katkı, aksi halde büyük bir endişe kaynağı olan gözlemlenmemiş kafa karıştırıcıların olduğu varsayımlar altında nedensel etkilerin tahmini için yöntemlerin toplanmasıdır. Yukarıdaki Pearl makalesinde Bölüm 3.3'e bakınız. Daha gelişmiş bir örnek, Marjinal Yapısal Modeller ve Epidemiyolojideki Nedensel Çıkarım belgesinde bulunabilir .
Test edilemez varsayımların geçerli olup olmadığı konusu bir konudur. Tam olarak denenemezler çünkü verileri kullanarak test edemiyoruz. Varsayımları doğrulamak için başka argümanlar gereklidir.
Makine öğrenmesi ve nedensel çıkarımın birleştiği yerin bir örneği olarak , Mark van der Laan ve Daniel Rubin tarafından Hedeflenen Maksimum Olabilirlik Öğrenmesi Öğrenme bölümünde sunulan hedeflenen maksimum olabilirlik tahmini tahminleri , tipik olarak "hedefleme" tarafından izlenen parametrik olmayan tahmin için makine öğrenim tekniklerini kullanır. "ilgilenilen bir parametreye doğru. İkincisi, nedensel yorumlamaya sahip bir parametre olabilir. Süper Öğrenicide Fikirilgilenilen parametrelerin tahmini için makine öğrenme tekniklerine dayanmaktır. Mark van der Laan (kişisel iletişim), klasik, basit ve "yorumlanabilir" istatistiksel modellerin çoğu zaman yanlış olduğu ve bu, önyargılı tahmin edicilere ve tahminlerin belirsizliğinin çok iyimser değerlendirmesine yol açan önemli bir noktadır.