Size varsayımsal bir çevrimiçi kümeleme uygulaması örneği göstereyim:
Mavi küme A'ya n puanları 1,2,3,4 ve kırmızı küme B'ye b, 5,6,7 noktaları tahsis edilir.
N + 1 zamanında, mavi kümeye A atanan ancak aynı zamanda b noktasının mavi kümeye A atanmasına neden olan yeni bir a noktası eklenir.
Bitiş noktalarında 1,2,3,4, a, b A'ya ve 5,6,7 B'ye aittir. Bana göre bu makul görünüyor.
İlk bakışta basit görünen şey aslında biraz zor - tanımlayıcıları zaman adımlarında korumak için. Bu noktayı daha sınırda bir örnekle netleştirmeye çalışalım:
Yeşil nokta, iki mavi ve iki kırmızı noktanın keyfi olarak maviyi renklendirmeye karar verdiğim bir kümede birleştirilmesine neden olacaktır - bu zaten işteki insan sezgisel düşüncemdir!
Bu kararı vermek için bir bilgisayarın kurallar kullanması gerekecektir. Örneğin, noktalar bir kümeye birleştirildiğinde, kümenin kimliği çoğunluk tarafından belirlenir. Bu durumda bir beraberlikle karşılaşırız - hem mavi hem de kırmızı, yeni (burada mavi renkli) küme için geçerli seçenekler olabilir.
Yeşil olana yakın beşinci bir kırmızı nokta düşünün. Sonra çoğunluk kırmızı olurdu (3 kırmızı vs 2 mavi), bu yüzden kırmızı yeni küme için iyi bir seçim olacaktır - ancak bu, en kırmızı küme için daha açık kırmızı seçimiyle çelişir, çünkü bunlar kırmızıdır ve muhtemelen bu şekilde kalmalıdır. .
Bunun hakkında düşünmeyi çok balık buluyorum. Günün sonunda bunun için mükemmel bir kural yok - daha ziyade bazı kararlılık kriterlerini optimize eden buluşsal yöntemler.
Bu sonunda sorularıma yol açıyor:
- Bu "sorunun" adı verilebilecek bir adı var mı?
- Bunun için "standart" çözümler var mı ve ...
- ... bunun için bir R paketi bile var mı?