Aşağıdaki, neyi başarmaya çalıştığımı açıklıyor, ancak alternatif bir sorun ifadesi hedefimi tanımlayabilir:
istiyorum
aşağıdaki sayıları, her gruptaki sayıların varyanslarının çok büyük olmadığı ve grupların ortalamaları arasındaki farkların çok küçük olmadığı gruplara ayırın
sonuçta elde edilen dağılımı "mükemmel" olanlarla karşılaştırır ve mükemmel olmaktan ne kadar "farklı" olduğunu görür.
Layman'ın hedef açıklaması
Gelir dağılımını hesaplamaya çalışıyorum ve her nüfusun içinde yer alan "gelir dilimlerini" belirlemeye çalışıyorum . Gelir diliminin girdi verilerine göre kendi kendini ayarlaması gerekiyordu.
Amacım, sonuç olarak gelir dilimleri arasındaki farkı ölçmek veya hesaplamaktır. Birçok parantez olacağını ve her katmanın ne kadar "ayrı" olduğunu görmek istiyorum.
Aşağıda, 20 kişilik bir nüfus seti ve toplam 3587 gelir için saatlik gelir örneği verilmiştir:
Population= 10 pop=2 population=5 population =3
10, 11,13,14,14,14,14,14,15,20, 40,50 ,90,91,92,93,94 999,999,900
Belirli bir popülasyonda gelir dağılımı gibi davranan verileri gruplandırmak, sıralamak ve analiz etmek için matematiksel kavramları nasıl kullanabilirim?
Hesaplamanın sonunda, mükemmel bir dağılımın (şuna) benzeyeceği katmanlı gelir dağılımını belirlemek istiyorum
(each person makes $10 more per hour than the previous; total is 3587)
89, 99, 109, 119, 129, 139, 149, 159, 169, 179, 189, 199, 209, 219, 229, 239, 249, 259, 269, 279
veya bu:
(evenly distributed groups of people make the same per hour)
(gaps between income groups is consistent and not "too far")
(income total is 3587)
99 99 99 129 129 129 159 159 159 199 199 199 229 229 229 269 269 269
Soru
Nüfus gruplarını nasıl analiz etmeliyim ve boşluğu, yukarıda listelenen son iki model seti gibi daha fazla yapmak için ne kadar gerekli olduğunu söyleyecek şekilde ölçmeliyim?
It may seem you are interested in cluster analysis, but the problem with real-life distributions is they are nearly continuous, and hence the straightforward clusterization won't apply.