Panel verileri için makine öğrenme algoritmaları


12

Bu soruda - Yapılandırılmış / hiyerarşik / çok düzeyli yordayıcıları dikkate alan karar ağaçları oluşturmak için bir yöntem var mı? - ağaçlar için panel veri yönteminden bahsediyorlar.

Vector Machines ve Yapay Sinir Ağlarını desteklemek için spesifik panel veri yöntemleri var mı? Eğer öyleyse, algoritmalar ve (eğer mevcutsa) R paketleri için bazı makaleler sunabilir misiniz?


1
Bunun için ne kullanmaya karar verdiğinizi merak ediyordum? Benzer bir sorunu çözmeye çalışıyorum.
user0

Yanıtlar:


1

LSTM (Uzun Kısa Süreli Bellek) sizin için uygun olabilir. Bu model türü, panel verilerine sığması gereken birden çok noktada birden çok özelliği işleyebilir. İşte LSTM kavramı hakkında çok güzel bir açıklama ve burada LSTM'nin R sürümünü uygulayan bir paket.


1

Panel verileriniz olduğunda, çözmeyi deneyebileceğiniz farklı görevler vardır, örneğin zaman serisi sınıflandırması / regresyonu veya panel tahmini. Ve her görev için, onu çözmek için çok sayıda yaklaşım vardır.

Panel tahminini çözmek için makine öğrenimi yöntemlerini kullanmak istediğinizde, birkaç yaklaşım vardır:

Girdi verileriniz (X), birimlere (örneğin ülkeler, bireyler, vb.) İid örnekleri gibi davranarak,

  • zaman serisine atlayın ve her bir kutuyu ayrı bir sütun olarak ele alın, herhangi bir geçici sıralamayı göz ardı ederek, tüm birimler için eşit kutularla birlikte, kutu boyutu elbette gözlemlenen zaman serisi ölçümü olabilir veya daha büyük kutulara örnekleyebilir ve toplayabilir, tablo verileri için standart makine öğrenme algoritmalarını kullanabilir,
  • veya her birim için zaman serisinden özellikleri ayıklayın ve ayıklanan her özelliği yine standart tablo algoritmalarıyla birlikte ayrı bir sütun olarak kullanın,
  • veya sürekli veya kategorik zaman serisi verilerini gözlemleyip gözlemlememenize bağlı olarak özel zaman serisi regresyon / sınıflandırma algoritmaları kullanın, buna zaman serilerini zaman serileri ile karşılaştıran özel çekirdekli destek vektör makineleri dahildir.

Çıktı verilerinizle (y) ilgili olarak, gelecekte birden fazla zaman noktası tahmin etmek isterseniz,

  • her zaman aynı giriş verilerini kullanarak, tahmin etmek istediğiniz her adım için bir tahmin edici kullanın,
  • ya da ileriye doğru ilk adım için tek bir kestirimci takın ve tahminlerde, ikinci adım tahminleri yapmak için gözlenen girdi verilerine eklemek üzere ilk adım tahminlerini kullanarak giriş verilerini zamanında yuvarlayın.

Yukarıdaki tüm yaklaşımlar temel olarak panel tahmin problemini bir zaman serisi regresyonuna veya tablo regresyon problemine indirgemektedir. Verileriniz zaman serileri veya sekmeli regresyon biçiminde olduğunda, kullanıcılar için herhangi bir zamanla değişmeyen özellikleri de ekleyebilirsiniz.

Tabii ki panel tahmin problemini çözmek için, panel verilerine uyarlanmış ARIMA gibi klasik tahmin yöntemlerini veya doğrudan dizi tahminlerine sekans yapmanıza izin veren derin öğrenme yöntemlerini kullanmak gibi başka seçenekler de vardır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.