prcomp()
Fonksiyonu, R'de bir PCA (temel bileşen analizi) gerçekleştirmek için kullandım. Ancak, bu fonksiyonda na.action
parametrenin çalışmadığı bir hata var . Stackoverflow konusunda yardım istedim ; iki kullanıcı, NA
değerlerle baş etmek için iki farklı yöntem sundu . Bununla birlikte, her iki çözümde de sorun, bir NA
değer olduğunda, bu sıranın PCA analizinde düşmemesi ve dikkate alınmamasıdır. Gerçek veri kümem 100 x 100'lük bir matristir ve tam bir satır kaybetmek istemiyorum çünkü sadece tek bir NA
değer içeriyor .
Aşağıdaki örnek, prcomp()
işlevin bir NA
değer içerdiği için satır 5 için ana bileşenleri döndürmediğini göstermektedir .
d <- data.frame(V1 = sample(1:100, 10), V2 = sample(1:100, 10),
V3 = sample(1:100, 10))
result <- prcomp(d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x # $
d$V1[5] <- NA # $
result <- prcomp(~V1+V2, data=d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x
Ben ayarlayabilirsiniz merak ediyordum NA
belirli sayısal değere değerleri zaman center
ve scale
ayarlanır TRUE
böylece prcomp()
fonksiyon eserleri ve içeren satırları kaldırmaz NA
PCA analizi sonucunu etkilemez, aynı zamanda 'ın ama.
NA
Değerleri tek bir sütundaki medyan değeriyle veya 0'a çok yakın bir değerle değiştirmeyi düşündüm. Ancak bunun PCA analizini nasıl etkilediğinden emin değilim.
Herhangi biri bu sorunu çözmenin iyi bir yolunu düşünebilir mi?
NA
değerlerin ne anlama geldiğini açıklamaktır : "eksikliğin" sebebi nedir?