Rastgele Orman kısmi bağımlılık grafiğindeki y ekseninin anlamı


13

RandomForestR paketini kullanıyorum ve Y ekseni değerlerini kısmi bağımlılık grafiklerinde nasıl yorumlayacağım konusunda kafam karıştı. Yardım belgeleri, planın "bir değişkenin sınıf olasılığı üzerindeki marjinal etkisinin grafiksel bir tasviri" olduğunu belirtir. Ancak, hala y ekseninin tam olarak neyi temsil ettiği konusunda kafam karıştı.

  • Özellikle, negatif değerler ne anlama geliyor?
  • Sınıfı doğru bir şekilde tahmin etmek üzerinde olumsuz bir etkiye sahip olmak ne anlama geliyor?
  • Ve bu rakamların en önemli özelliği nedir, maksimum değer mi, trendin şekli mi?
  • Kısmi grafikleri diğer değişkenlerin kısmi grafikleri ile karşılaştırabilir misiniz?
  • Bu grafikler Maxent'te (bir dağıtım modelleme yazılımı) oluşturulan yanıt eğrileriyle nasıl karşılaştırılabilir?

Bazı örnek kısmi bağımlılık grafikleri

Yanıtlar:


7

Önce bu ikisine cevap veriyoruz:

Özellikle, negatif değerler ne anlama geliyor? Sınıfı doğru bir şekilde tahmin etmek üzerinde olumsuz bir etkiye sahip olmak ne anlama geliyor?

Rastgele Orman paket belgelerinde kısmi grafiğin nasıl hesaplandığının tanımına bakarsanız , grafiklerin değişkenin sınıf perspektifindeki göreceli logit katkısını model perspektifinden gösterdiği söylenir. Başka bir deyişle, negatif değerler (y ekseninde), pozitif sınıfın modele göre bağımsız değişkenin (x ekseni) değeri için daha az olası olduğu anlamına gelir. Benzer şekilde pozitif değerler, pozitif sınıfın modele göre bağımsız değişkenin bu değeri için daha olası olduğu anlamına gelir. Açıkçası sıfır, modele göre sınıf olasılığı üzerinde ortalama bir etki anlamına gelmez.

Ve bu rakamların en önemli özelliği nedir, maksimum değer mi, trendin şekli mi?

Özellik önemini belirlemek için birçok farklı yaklaşım vardır ve maksimum mutlak değer basit bir önlemdir. Tipik olarak, insanlar modelin değişkenlerden sınıf etiketlerine olan ilişki hakkında ne önerdiğini anlamak için kısmi grafiklerin şekline bakarlar.

Kısmi grafikleri diğer değişkenlerin kısmi grafikleri ile karşılaştırabilir misiniz?

Bunun cevabı daha az siyah beyaz. Her grafik için y ekseni aralığına belirli bir şekilde bakabilirsiniz; Bir değişkene kısmi bağımlılık, değişkenin tüm aralığı için sıfıra yakınsa, bu, modelin değişkenten sınıf etiketine herhangi bir ilişkisi olmadığını söyler. Sorunuza geri dönersek, menzil ne kadar büyük olursa, toplam etki o kadar güçlü olur, bu nedenle bu anlamda karşılaştırılabilirler.

Maxent ile hiçbir deneyimim yok.


Modelin 2 sınıflandırma için olduğunu, hangi sınıfın pozitif sınıf ve hangisinin negatif olduğunu nasıl belirleyebiliriz?
Kumar Vaibhav

Bu iyi bir soru, denemeniz ve görmeniz gerekecek. Dokümantasyon diyor burada sayfa 17 eğer ybir faktördür o zaman bunun sınıflandırma problem varsayar. Ancak hangi faktörün pozitif sınıfa veya negatif sınıfa eşleştirileceğini söylemez. 1 veya true değerinin pozitif sınıfa ve 0, -1 veya false değerinin negatif sınıfa eşlendiğini umuyorum, ancak bunu R'de verilenler için kabul etmem.
Chris A.

içinde bir which.classargüman var partialPlotve varsayılan olarak ilk faktörün seviyesi y. Yani ilk seviye ynegatif durum ise, o partialPlotzaman negatif durumları tahmin edersiniz, ki bu beklendiği gibi olmayabilir.
qoheleth
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.