Zaman serileri nasıl kümelenir?


22

Küme analizi hakkında bir sorum var. 5 yıl boyunca güç kullanımlarına göre kümelenmesi gereken 3000 şirket var. Her şirketin 5 yıl boyunca her saat için değerleri vardır. Bazı şirketlerin zaman içinde kullanım gücünde aynı örüntüye sahip olup olmadığını öğrenmek istiyorum. Sonuçlar, güç kullanımının günlük tahmini için kullanılmalıdır. SPSS'de zaman serilerini nasıl kümeleyeceğiniz konusunda bazı fikirleriniz varsa, lütfen benimle paylaşın.


1
Sayfanın sağ tarafındaki ilgili bağlantılara göz atmanızı öneririm. Çok benzer nitelikte birkaç soru var, bkz . Eğri şekline dayalı zaman serisi kümeleme yapmak mümkün mü? ve Zaman etkisinin iki örnek için bireyler arasında işlevsel biçimde değiştiği boylamsal verilerin modellenmesi .
Andy W

Proc SAS'taki benzerlik zaman serilerini kümeleyebilir.
tahminci

Yanıtlar:


11

A) Verilerin önişlenmesi için çok zaman harcayın . Önişleme işinizin% 90'ıdır.

B) Zaman serileri için uygun bir benzerlik ölçüsü seçin. Örneğin, eşik geçiş mesafesi burada iyi bir seçim olabilir. Farklı saat dilimleriniz olmadığı sürece muhtemelen dinamik zaman atlama mesafesini istemezsiniz. Eşik geçiş, zamansal kalıpları tespit etmek için daha uygun olabilirken, gerçek büyüklüğe dikkat etmemekle birlikte (muhtemelen şirketten şirkete çok farklı olacaktır).

C) Sonuç olarak ortaya çıkan uyumsuzluk matrisini, rasgele mesafe işlevleriyle çalışabilen hiyerarşik kümeleme veya DBSCAN gibi yöntemleri kullanarak kümeleyin.


Dinamik zaman atlama mesafesinin zaman serisi kümelemesi için neden iyi bir seçenek olmadığını açıklayabilir misiniz?
Hardik Gupta

Bu genel bir açıklama değildi. İyi olup olmadığı zaman eğrilmesine izin vermek isteyip istemediğinize bağlıdır.
Anonim-Mousse-Monica

7

Günlük, haftalık ve yıllık periyodiklik ile saatlik zaman serisini tahmin etmek isteyebilirsinizgünlük verileri ve tatilleri / regresörleri içeren saatlik verilerin tartışılması için. 5 yıllık verileriniz varken, diğer tartışma 883 günlük değer içeriyordu. Önerebileceğim, haftanın günü gibi regresörleri içeren saatlik bir tahmin oluşturabileceğiniz; yılın bir haftası ve günlük toplamları ek bir öngörücü olarak kullanan tatiller. Bu şekilde 3.000 şirketin her biri için 24 modeliniz olacaktır. Şimdi yapmak istediğiniz şey saattir, her bir regresör, haftanın günü, haftanın günündeki değişiklikler etrafında tepki şeklini hesaplayan ortak bir ARIMAX yapısı kullanarak 3.000 modeli tahmin edin aykırı değerleri izole ederken parametreler ve haftalık göstergeler. Ardından, 3000 şirketin tamamını kullanarak parametreleri küresel olarak tahmin edebilirsiniz. Bir Chow Test yapın http://en.wikipedia.org/wiki/Chow_testparametrelerin sabitliği için ve ret üzerine şirketler homojen gruplara ayrılır. Bunu tek boyutlu küme analizi olarak adlandırdım. SPSS zaman serilerinde çok sınırlı özelliklere sahip olduğundan, başka hiçbir yerde yazılım aramak istemeyebilirsiniz.


1
"vanilya", R hakkında kullanılacak tuhaf bir kelime gibi görünür; daha olağan R terminolojisinde çeviri konusunda net değildir. Temel R ve CRAN'dan ekstra katkıda bulunan paketler arasındaki herhangi bir ayrım, eşit derecede özgür ve eşit derecede erişilebilir olduklarından deneyimli kullanıcıları ve hatta acemi kullanıcıları ısırmaz. Benim izlenimim, SPSS'ye erişimi olan birisinin şu anda programlama olmadan SPSS'de bir şeyin mümkün olmadığını oldukça kolay söyleyebileceğidir; R hakkında aynı şeyi söylemek, tüm zaman serisi paketlerine aşina olmayı gerektirir.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.