Zaman sıralı veriler için gözetimsiz öğrenme algoritmaları var mı?


9

Verilerimdeki her gözlem 0,1 saniye farkla toplandı. Buna zaman dizisi demiyorum çünkü tarih ve zaman damgası yok. Kümeleme algoritmaları (çevrimiçi buldum) ve PCA örneklerinde, örnek veriler vaka başına 1 gözlem içerir ve zamanlanmaz. Ancak verilerim araç başına her 0.1 saniyede bir toplanan yüzlerce gözlem içeriyor ve birçok araç var.

Not: Bu soruyu quora'da da sordum.


1
Lütfen dili not edin. Sorunuz tamamen belirsiz. "Örnek veriler vaka başına 1 gözlem içerir ve zamanlanmamıştır" ne anlama gelir?
Kasra Manshaei

1
Çevrimiçi derslerde bulduğum örnekler hakkında konuşuyordum. Kullandıkları örnek veriler vaka başına / birey başına yalnızca 1 gözlem içerir (örn. Müşteri, ülke vb.). Ve bu veriler zaman serisi değil.
umair durrani

Yanıtlar:


7

Sahip olduğunuz zamana göre bir dizi olaydır, bu yüzden ona Zaman Dizisi demekten çekinmeyin!

Zaman serilerindeki kümelenmenin 2 farklı anlamı vardır:

  1. Zaman serilerinin bölümlendirilmesi, yani tek bir zaman serisini iç benzerliklere göre farklı zaman aralıklarına bölmek istediğinizdir.
  2. Zaman serisi kümeleme yani birkaç zaman diziniz var ve bunlar arasındaki benzerliklere göre farklı kümeler bulmak istiyorsunuz.

Sanırım ikincisini kastediyorsunuz ve işte önerim:

Araç başına birçok aracınız ve gözleminiz var, yani birçok aracınız var. Yani birkaç matrisiniz var (her araç bir matristir) ve her matris N satır (gözlem sayısı) ve T sütunları (zaman noktaları) içerir. Bir öneri, boyutsallığı azaltmak ve PC uzayındaki verileri gözlemlemek ve bir matris (araç) içindeki farklı gözlemler arasında anlamlı ilişkiler olup olmadığını görmek için her matrise PCA uygulamak olabilir . Daha sonra tüm araçlar için her bir gözlemi birbirine koyabilir ve bir matris yapabilir ve farklı araçlar arasındaki tek bir gözlemin ilişkilerini görmek için PCA'yı uygulayabilirsiniz.

Negatif değerleriniz yoksa , matris form verilerinin boyut küçültülmesi için Matris Faktorizasyonu önemle tavsiye edilir.

Başka bir öneri birbirinin Putin'in tüm matrisler olabilir ve bir inşa edebileceğini K x K x T tensörünün K araç sayısıdır, E gözlem sayısı ve T zaman dizisi ve geçerli tensör Decomposition küresel ilişkileri görmek için.

Uygulamanın doğrudan sessiz olduğu bu makalede Zaman Dizisi Kümelemesine çok hoş bir yaklaşım gösterilmektedir .

Umarım yardımcı olmuştur!

İyi şanslar :)


DÜZENLE

Bahsettiğiniz gibi, Zaman Serisi Segmentasyonu demek istedim Bunu cevaba ekliyorum.

Zaman serisi segmentasyonu, değerlendirme için temel gerçeğe sahip tek kümeleme problemidir. Nitekim Zaman serisinin arkasındaki üreten dağılımını düşünün ve şiddetle tavsiye analiz bu , bu , bu , bu , bu ve bu senin sorunun derinlemesine incelenmiş nerede. Özellikle sonuncusu ve doktora tezi.

İyi şanslar!


1
Harika bir cevap için teşekkürler. Aslında amacım, veri setimdeki her araç için "zaman serilerinin segmentasyonu" yapmak.
umair durrani

1
Zaman serileri ayrışımı üzerine dersler okuyorum. Bunları trend, mevsimsel ve döngüsel bileşenlere ayırmanın yolları olduğunu buldum. Ancak benim zaman serim araç yörüngelerinin birkaç saniyesidir. Gözlemlenen yörüngedeki ivme, hız, kurşun araç hızı ve ivme trendlerine bağlı olarak farklı sürüş davranışı bileşenlerine ayrıştırmak mümkün müdür?
umair durrani

2
Olabilir! bunun için hem "ayrışma" hem de "segmentasyon" düşünülmelidir. Örneğin, zaman serileriniz PC alanında önemli kümeler gösteriyorsa, bunları sürüş davranışıyla ilişkilendirebilirsiniz. Segmentasyon aynı zamanda bir zaman serisi içindeki farklı sürüş davranışlarını tespit etmektir. Uzun öykü kısa, bir araç için farklı sürüş davranışı segmentleri için segmentasyonu ve tüm araçlarda küresel sürüş davranışlarını tespit etmek için ayrışma tekniklerini kullanabilmenizdir.
Kasra Manshaei
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.