Zaman serisi verilerim var. Her seri aynı dönemi kapsar, ancak her zaman serisindeki gerçek tarihler tam olarak 'sıralanmayabilir'.
Diğer bir deyişle, eğer Zaman dizisi bir 2D matriste okunacak olsaydı, şöyle görünürdü:
date T1 T2 T3 .... TN
1/1/01 100 59 42 N/A
2/1/01 120 29 N/A 42.5
3/1/01 110 N/A 12 36.82
4/1/01 N/A 59 40 61.82
5/1/01 05 99 42 23.68
...
31/12/01 100 59 42 N/A
etc
{T1, T2, ... TN} zaman serisini, bir ailenin birbiriyle "sempati içinde hareket etme eğiliminde" olan bir dizi dizisi olarak tanımlandığı 'ailelere' ayrılacak bir R betiği yazmak istiyorum.
'Kümelenme' kısmı için bir çeşit uzaklık ölçüsü seçmem / tanımlamam gerekecek. Nasıl devam edeceğimi tam olarak bilemiyorum, çünkü zaman serileriyle ilgileniyorum ve sempati içinde bir aralıkta hareket edebilen bir çift dizi bunu daha sonraki bir aralıkta yapamayabilir.
Burada benden çok daha deneyimli / zeki insanlar bulunduğundan eminim; bu nedenle önerileriniz için, mesafe ölçüsü için hangi algoritma / sezgisel bir yöntem kullanacağınıza ve zaman serisini kümelemede nasıl kullanacağınıza dair fikirler için minnettar olurum.
Benim tahminim, bunu yapmak için sağlam bir istatistik yöntemi OLMADIĞINI, bu yüzden insanların bu soruna nasıl yaklaştığını / çözdüğünü - bir istatistikçi gibi düşünerek - çok ilgileneceğim.