Bayesian Networks ne zaman diğer makine öğrenimi yaklaşımları üzerinde kullanılır?


13

Bu sorunun kesin bir cevabı olmayabilir. Ama geçmişte bir dizi makine öğrenme algoritması kullandım ve Bayesian Ağları hakkında bilgi edinmeye çalışıyorum. Hangi koşullar altında veya Bayesian Network'ü diğer yaklaşımlar üzerinde ne tür problemler için kullanmayı tercih edersiniz?


3
Benim için Bayes Ağları bir modeldeki koşullu bağımsızlıkları tanımlamanın bir yoludur. Bunu tanımladıktan sonra, sanırım model parametrelerini tahmin etmek için çeşitli öğrenme araçlarını kullanabilirsiniz. Dolayısıyla, parametre öğrenme ile model arasında açık bir ayrım görüyorum. Bununla birlikte, bu konuda uzman değilim, böylece biri daha iyi bir cevap verebilir.
Luca

Yanıtlar:


8

Bayes Ağları (BN'ler) üretken modellerdir. Bir dizi girişiniz, ve çıkışınız olduğunu varsayın . BN'ler , lojistik regresyon ya da koşullu dağılımı modelleyen Destek Vektör Makinesi diyelim aksine , ortak dağıtım öğrenmenize izin verir .Y P ( X , Y ) P ( Y | X )XYP(X,Y)P(Y|X)

Verilerin ortak olasılık dağılımını (üretken model) öğrenmek, koşullu olasılığı (ayrımcı modeller) öğrenmekten daha zordur. Bununla birlikte, birincisi veya vb. Gibi sorguları çalıştırabileceğiniz daha çok yönlü bir model sağlar . Ayrımcı modelde tek amacınız öğrenmektir. .P ( X 1 | X 2 = A , X 3 = B ) P ( Y | X )P(X1|Y)P(X1|X2=A,X3=B)P(Y|X)

BN'ler, ortak dağılımı reçete etmek için DAG'ları kullanır. Dolayısıyla grafiksel modeller.

Avantajları:

  1. Örneğin tıpta çok fazla eksik veriniz olduğunda, BN'ler eklem dağılımının modellenmesi (yani verilerin nasıl üretildiğine dair iddianız) tamamen gözlenen bir veri kümesine bağımlılığınızı azalttığından çok etkili olabilir.

  2. Bir alanı görsel olarak şeffaf olacak şekilde ve aynı zamanda ilişkilerini yakalamayı amaçlayan bir şekilde modellemek istediğinizde , BN'ler çok güçlü olabilir. BN'lerde nedensellik varsayımının tartışmaya açık olduğunu unutmayın.causeeffect

  3. Eklem dağılımını öğrenmek zor bir görevdir, ayrık değişkenler için modellenmesi (koşullu olasılık tablolarının, yani CPT'lerin hesaplanması yoluyla), sürekli değişkenler için aynısını yapmaya çalışmaktan çok daha kolaydır. Dolayısıyla BN'ler, ayrık değişkenlerle pratikte daha yaygındır.

  4. BN'ler sadece (tüm makine öğrenme modellerinin izin verdiği gibi) gözlemsel çıkarımlara değil, aynı zamanda nedensel müdahalelere de izin verir . Bu, BN'lerin yaygın olarak ihmal edilmiş ve takdir edilmemiş bir avantajıdır ve karşı-olgusal akıl yürütmeyle ilgilidir.


1
BN'lerin çok sayıda eksik değeri olan verileri modellemek için etkili olduğunu söylediğiniz avantaj 1'de, bu eksik değerler verilerdeki bağımsızlıkların doğru tanımlanmasını etkilemez mi?
Hossein

1
Evet, modeli takarken yine de bazı varsayımlarla taciz etmeniz gerekir, ancak DAG'ınızın çarpanlarına (bağımsızlık varsayımlarınızı içine alan bağlı olarak , örneğin için bir yapınız varsa, gerekmeyebilir halinde zaten mevcuttur, ya da tam tersi. X 1 X 2P(Y,X1,X2)X1X2
Zhubarb

1

Deneyimlerime göre, Bayesian Ağları yüksek boyutlu kategorik veriler olduğunda çok iyi çalışıyor . Farklı değişkenlerin nasıl etkileşime girdiğini anlamasına yardımcı olan (bazen) yorumlanabilir modeller sunarlar.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.