Akan en popüler müzik sanatçıları hakkında, bölgeye göre yaklaşık 200 kongre bölgesine bölünmüş ilginç verilerim var. Bir kişiyi müzikal tercihleri hakkında sorgulamanın mümkün olup olmadığını görmek ve "Demokrat gibi dinliyor" ya da "Cumhuriyetçi gibi dinliyor" diye karar vermek istiyorum. (Doğal olarak bu hafif yürekli, ancak verilerde gerçek bir entropi var!)
Yaklaşık 100 sanatçıyla ilgili verilerim ve son üç seçim döngüsü boyunca her bir bölgedeki Cumhuriyetçiler ve Demokratlar için ortalama yüzde oylarım var. Bu yüzden her sanatçının üzerinde, hangilerinin en çok dinlendiğini görmek için bir korelasyon yürüttüm - Demokratlar için bir oy payı fonksiyonu olarak. Bu korelasyonlar herhangi bir sanatçı için yaklaşık -0.3 ila 0.3 arasındadır, ortada çok az tahmin gücü olan veya hiç olmayan gücü vardır.
İki sorum var: Birincisi, bölge başına toplam akış sayısı büyük ölçüde değişiyor. Şu anda, ilçe başına Beyonce'ye ait tüm akarsuların yüzdesini Demokratlar için kullanılan oyların yüzdesi ile ilişkilendiriyorum. Ancak bir bölgedeki toplam akış milyonlarca, diğeri ise düşük 100.000'lerde olabilir. Bunu açıklamak için korelasyonu bir şekilde ağırlıklandırmam gerekir mi?
İkincisi, bu korelasyonları kullanıcının politikasıyla ilgili birleşik bir tahminde nasıl birleştireceğimizi merak ediyorum. Diyelim ki en yüksek mutlak korelasyon değerlerine sahip (pozitif ve negatif), her yönde on tane olan ve bir kullanıcıyı her bir sanatçıyı ne kadar sevdiğine dair ankete katıyorum. Bu yüzden her sanatçı için yukarı veya aşağı oy kullanıyorum ve 20 değerin tümü için siyasetle olan ilişkim var. Bu korelasyonları tek bir tahminde birleştirmenin standart bir yolu var mı? (NYTimes'ın 25 soru için bölgesel olasılıkları bir ısı haritasına birleştirdiği ünlü lehçe sınavı gibi bir şey düşünüyorum . Ama bu durumda Demokrat ya da Cumhuriyetçi müziğin zevkinin ne olduğu konusunda tek bir değere ihtiyacım var.
Teşekkür ederim!