En yakın komşuların en iyi yordayıcılar olduğu varsayımıyla veri kümem var. Görselleştirilmiş iki yönlü eğimin mükemmel bir örneği
Birkaç değerin eksik olduğu bir vakamız olduğunu varsayalım, komşulara ve eğilime göre kolayca tahmin edebiliriz.
R'de karşılık gelen veri matrisi (egzersiz için kukla örnek):
miss.mat <- matrix (c(5:11, 6:10, NA,12, 7:13, 8:14, 9:12, NA, 14:15, 10:16),ncol=7, byrow = TRUE)
miss.mat
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] 5 6 7 8 9 10 11
[2,] 6 7 8 9 10 NA 12
[3,] 7 8 9 10 11 12 13
[4,] 8 9 10 11 12 13 14
[5,] 9 10 11 12 NA 14 15
[6,] 10 11 12 13 14 15 16
Notlar: (1) Eksik değerlerin özelliğinin rastgele olduğu varsayılır , her yerde olabilir.
(2) Tüm veri noktaları tek değişkenlidir, ancak değerlerinin kendilerine neighbors
bitişik satır ve sütundan etkilendiği varsayılmaktadır . Bu nedenle matristeki konum önemlidir ve diğer değişken olarak kabul edilebilir.
Umudum bazı durumlarda bazı off-değerleri tahmin edebilir (hatalar olabilir) ve önyargıları düzeltebilirim (sadece örnek, kukla verilerde böyle bir hata oluşturmanızı sağlar):
> mat2 <- matrix (c(4:10, 5, 16, 7, 11, 9:11, 6:12, 7:13, 8:14, 9:13, 4,15, 10:11, 2, 13:16),ncol=7, byrow = TRUE)
> mat2
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] 4 5 6 7 8 9 10
[2,] 5 16 7 11 9 10 11
[3,] 6 7 8 9 10 11 12
[4,] 7 8 9 10 11 12 13
[5,] 8 9 10 11 12 13 14
[6,] 9 10 11 12 13 4 15
[7,] 10 11 2 13 14 15 16
Yukarıdaki örnekler sadece açıklama amaçlıdır (görsel olarak cevaplanabilir), ancak gerçek örnek daha kafa karıştırıcı olabilir. Böyle bir analiz yapmak için sağlam bir yöntem olup olmadığına bakıyorum. Bence bu mümkün olmalı. Bu tür bir analizi gerçekleştirmek için uygun yöntem ne olabilir? herhangi bir R programı / paket bu tür analiz yapmak için öneriler?