Obama'nın kampanyasında veri madenciliği teknikleri


10

Obama'nın yeniden seçim kampanyasında veri madenciliği ekibi hakkında bu makaleye rastladım . Ne yazık ki, makale istatistiksel algoritmaların gerçek makineleri hakkında çok bulanık. Ancak, sanki genel teknikler sosyal ve siyasal bilimlerde biliniyor gibiydi. Bu benim uzmanlık alanım olmadığından, kimse bu tür tekniklerle ilgili literatüre (genel bakış) işaret edebilir mi?

Yanıtlar:


16

Bu alana mikro hedefleme denir (bunun için google istiyorsanız). Kampanyalar yüzden bildiğim kadarıyla çok Hal MALCHOW en haricinde çalışmalarını yayınladığı yoktur, kendi araçları ve prosedürleri hakkında oldukça ketum olan Siyasi Hedefleme (2008) ya da Yeşil ve Gerber en (2008) çık Oy: Seçmen Katılımı Artırma Nasıl (ikincisi fırsatları reklamların etkili olduğu ve benzeri gibi sosyal bilim yönleriyle daha fazla).

Daha teknik konularda literatür daha da kıttır , ancak bkz. Örneğin Murray & Scime (2010) , Imai & Strauss (2011) ( son baskı ) tarafından hazırlanan Politik Analiz makalesi veya Rusch, Lee, Hornik, Jank ve Zeileis (2013) ( baskı sonrası ). Hepsinin ortak noktası, çoğunlukla ağaç temelli olan veri madenciliği tekniklerini kullanmalarıdır.

Murray & Scime, CART gibi standart sınıflandırma ağaçlarını kullanır.

Rusch ve diğ. sınıflandırma ağaçları, lojistik modeller ve ağaçların melezlenmesi ve lojistik regresyonu kullanır. Ayrıca, (diğerlerinin yanı sıra) , kağıda bağlandığında açıklandığı gibi, ağaç melezleriyle karşılaştırmak için rastgele ormanlar, sinir ağları, destek vektör makineleri ve Bayesian Katkı Regresyon ağaçlarını kullanırlar . Hibrit ağaçları, veri kümelerindeki diğer yöntemlerle eşit performans gösterdi ve daha fazla yorumlanabilirlik sunuyor (ayrıca kodlarını ve verilerini paylaşıyoruz).

Imai & Strauss, sadece diğerlerinin yaptığı gibi mikro hedefleme araçları için değil, optimum kampanya planlaması için kapsamlı bir karar teorik çerçevesi sundukları sürece ilginçtir. Bu nedenle, bir kampanyaya konulan her bir dolardan en iyi şekilde nasıl yararlanabileceğine dair operasyonel araştırmanın yönlerine odaklanıyorlar. Mikro hedefleme ve katılım tahmini için istatistiksel teknikler kullandıkları çerçevelerinde, yine sınıflandırma ağaçlarına güvenmektedirler.

Dolayısıyla, ağaç tabanlı yöntemlerin kullanımının bu alanda iyi çalıştığı konusunda bazı fikir birliği var gibi görünmektedir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.