Dört sayısal değişkenim var. Hepsi toprak kalitesinin ölçüsüdür. Değişken ne kadar yüksek olursa kalite de o kadar yüksek olur. Hepsi için aralığı farklıdır:
1 ile 10 arasında Var1
1000 ila 2000 arasında Var2
150 ile 300 arasında Var3
0 ile 5 arasında Var4
Sırasıyla başarılı bir şekilde sıralama yapacak dört değişkeni tek bir toprak kalite puanı ile birleştirmem gerekiyor.
Benim fikrim çok basit. Dört değişkeni de standardize edin, özetleyin ve ne alırsanız alınsın, sıralaması gereken puan. Bu yaklaşımı uygularken herhangi bir sorun görüyor musunuz? Tavsiye edebileceğiniz başka (daha iyi) bir yaklaşım var mı?
Teşekkürler
Düzenle:
Teşekkürler beyler. Çok fazla tartışma "alan uzmanlığı" haline geldi ... Tarım işleri ... Oysa daha fazla istatistik konuşması bekleniyordu. Kullanacağım teknik açısından ... Muhtemelen basit bir z-puanı toplama + bir deney olarak lojistik regresyon olacaktır. Örneklerin büyük çoğunluğu kalitesizliği% 90 olduğu için 3 kalite kategorisini bir kategoride birleştireceğim ve temelde ikili problemi yaşayacağım (kalitesizlik gibi). Bir taşla iki kuş öldürürüm. Örneğimi olay oranı cinsinden arttırıyorum ve uzmanlarımı numunelerimi sınıflandırmasına yardımcı olarak kullanıyorum. Uzman sınıflandırılmış örnekler daha sonra log-reg modeline uymak için uzmanlarla uyum / uyumsuzluk seviyesini en üst düzeye çıkarmak için kullanılacaktır ... Bu size nasıl geliyor?