2
Kayıt bağlama için EM algoritmasını kullanma
2 veri kümesindeki kayıtları ad, soyad ve doğum yılına göre ilişkilendirmekle ilgileniyorum. Bu EM algoritması ile yapılabilir ve eğer öyleyse, nasıl? Örnek olarak 1.'de şu rekoru ele alalım: Carl McCarthy, 1967. 2. veri kümesindeki tüm kayıtları arayacağım ve 1. ad ve Carl arasında bir jaro-winkler mesafesi ve soyadı ile McCarthy …