Çok partili sistemde seçim sonucunu hesaplamak için hangi regresyon kullanılır?


11

Parlamento seçimlerinin sonucunu tahmin etmek istiyorum. Çıktım, her bir tarafın aldığı% olacak. 2'den fazla parti var, bu nedenle lojistik regresyon uygulanabilir bir seçenek değil. Her taraf için ayrı bir gerileme yapabilirdim, ancak bu durumda sonuçlar bir şekilde birbirinden bağımsız olur. Sonuçların toplamının% 100 olmasını sağlamaz.

Hangi regresyonu (veya başka bir yöntemi) kullanmalıyım? Bu yöntemi belirli bir kütüphane aracılığıyla R veya Python'da kullanmak mümkün müdür?


Çıktınızı ikili olarak değiştirmenize izin verilirse (hangi partinin kazandığına bağlı olarak), çok terimli lojistik regresyon iyi bir seçimdir. Hala istediğiniz gibi olmayan bağımsız çıktıları düşünüyor.
Robert Smith

Yanıtlar:


5

Robert haklı, multinomiyal lojistik regresyon kullanmak için en iyi araçtır. Partiyi bağımlı değişken olarak temsil eden bir tamsayı değerine sahip olmanız gerekmesine rağmen, örneğin:

1 = Muhafazakar çoğunluk, 2 = İşçi çoğunluğu, 3 = Liberal çoğunluk .... (vb.)

Bunu nnet paketini kullanarak R'de yapabilirsiniz. İşte nasıl hızlı bir şekilde çalıştırmak için iyi bir yer.


3

Tahmininizi neye dayandırmak istiyorsunuz? Tezim için çok yıllı seçim sonuçlarını önceki yıllara dayalı olarak tahmin etmeye çalıştım ve daha sonra bu yılki bazı seçim merkezlerinin sonuçlarını kullanarak diğer tüm seçim merkezlerindeki sonuçları tahmin ettim. Bunun için karşılaştırdığım doğrusal model, her iki tarafın önceki yıllardaki oylar üzerinde gerileyerek alacağı oy sayısını tahmin ediyordu. Tüm taraflar için tahmini oy sayısına sahipseniz, bu oranın yüzdesini hesaplayabilirsiniz. Doğrusal modeli genişleten ilgili kağıt için Rastgele Olmayan Örneklerden Tahminler'e bakın .


2

Bu bir gerileme değil, çok sınıflı bir sınıflandırma problemidir. Çıktı tipik olarak herhangi bir test örneği (test satırı) için tüm sınıfların olasılıklarıdır. Yani sizin durumunuzda, eğitilmiş modelden herhangi bir test satırı için çıktı şu şekildedir:

prob_1, prob_2, prob_3,..., prob_k

burada prob_i, yanıt değişkeninde k sınıfları olduğunu varsayarak, i. Bu k olasılıklarının toplamının 1 olacağını unutmayın. Bu durumda sınıf tahmini, maksimum olasılığa sahip olan sınıf olacaktır.

R'de çok sınıflı sınıflandırma yapan birçok sınıflandırıcı vardır. R'deki nnet paketi aracılığıyla ve multinomkomutu çağırarak çok sınıflı destekle lojistik regresyonu kullanabilirsiniz .

Alternatif olarak, r'deki gbm paketini kullanabilir ve gbmkomutu çağırabilirsiniz . Çok sınıflı bir sınıflandırıcı oluşturmak için sadece distribution="multinomial" while using thegbm` işlevini kullanın .

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.