CART ağaçları tahmin ediciler arasındaki etkileşimleri yakalar mı?


9

Bu makale , CART'ta, her adımda tek bir ortak değişken üzerinde ikili bir bölünme gerçekleştirildiğinden, tüm bölünmelerin dik olduğunu ve bu nedenle ortak değişkenler arasındaki etkileşimlerin dikkate alınmadığını iddia etmektedir.

Bununla birlikte, birçok ciddi referans, aksine, bir ağacın hiyerarşik yapısının, öngörücüler arasındaki etkileşimlerin otomatik olarak modellenmesini (örneğin, bu makale ve elbette Hastie) garanti ettiğini iddia etmektedir.

Kim haklı? CART ile yetiştirilen ağaçlar girdi değişkenleri arasındaki etkileşimleri yakalar mı?


Argümandaki kusur, bölünmelerin daha önce yapılan bölünmelerle tanımlanan ortak değişkenlerin alt kümeleri üzerinde yapılmasıdır.

@mbq böylece yeni bölünmeler önceki bölünmelere göre şartlı ... Anlıyorum ... Sanırım "belirli bir yordayıcıda yapılan bir önceki bölünmenin şartlandırılması" nın "bu yordayıcıyla etkileşimde bulunmaya eşdeğer olduğunu" anlamakta zorlanıyordum "...
Antoine

Yanıtlar:


12

CART olabilir etkileşim efektleri yakalamak. ve arasındaki etkileşim etkisi , açıklayıcı değişkeninin yanıt değişkeni üzerindeki etkisi seviyesine bağlı olduğunda ortaya çıkar . Bu, aşağıdaki örnekte gerçekleşir:X1X2X1YX2

resim açıklamasını buraya girin

Kötü ekonomik koşulların etkisi (buna deyin ) satın alınan bina türüne bağlıdır ( ). Bir ofis binasına yatırım yaparken, düşük ekonomik koşullar yatırımın öngörülen değerini 140.000 dolar azaltır. Ancak bir apartman binasına yatırım yaparken, yatırımın tahmini değeri 20.000 dolar azalır. Kötü ekonomik koşulların yatırımınızın tahmini değeri üzerindeki etkisi, satın alınan mülk türüne bağlıdır. Bu bir etkileşim etkisidir.X1X2


3

Kısa cevap

CART'lar etkileşimleri yakalamak için yardıma ihtiyaç duyar.

Uzun cevap

Tam açgözlü algoritmayı ele alalım (Chen ve Guestrin, 2016):

Tam açgözlü algoritma

Yaprak üzerindeki ortalama şartlı bir beklenti olacaktır, ancak yaprağa giden yoldaki her bölünme diğerinden bağımsızdır. Özellik A kendi başına önemli değilse, ancak Özellik B ile etkileşimde önemliyse, algoritma Özellik A'ya bölünmez. Bu bölünme olmadan, algoritma etkileşimi oluşturmak için gerekli Özellik B'deki bölünmeyi öngöremez.

Ağaçlar en basit senaryolarda etkileşimleri seçebilir. İki özelliğe sahip bir veri kümeniz varsax1,x2 ve hedef y=XOR(x1,x2), algoritmanın bölünecek bir şeyi yok ama x1ve , bu nedenle, düzgün bir şekilde tahmin edilen dört yaprak alırsınız .x2XOR

Birçok özellik, düzenleme ve bölünme sayısı üzerindeki kesin sınır ile, aynı algoritma etkileşimleri atlayabilir.

Geçici Çözümler

Yeni özellikler olarak açık etkileşimler

Zhang'dan bir örnek ("Kazanan Veri Bilimi Yarışmaları", 2015):

Etkileşimler hakkında Zhang

Açgözlü olmayan ağaç algoritmaları

Diğer soruda Simone , ileriye dönük algoritmalar ve eğik karar ağaçları öneriyor .

Farklı bir öğrenme yaklaşımı

Bazı öğrenme yöntemleri etkileşimleri daha iyi ele alır.

İşte İstatistiksel Öğrenmenin Unsurlarından bir tablo ("Doğrusal özellik kombinasyonlarını çıkarma yeteneği" satırı):

Öğrenme yöntemlerinin karşılaştırılması

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.