Dinamik Zaman Çözgü ve normalleştirme


9

Bir "sorgu" ve bir "şablon" eğrisi maç ve şimdiye kadar makul bir başarı elde etmek için Dinamik Zaman Çözgü kullanıyorum, ama bazı temel soruları var:

  1. DTW sonucunun sezgisel olarak bulduğum bir eşik değerden daha düşük olup olmadığını değerlendirerek bir "maç" ı değerlendiriyorum. DTW kullanarak bir “eşleşme” belirlemenin genel yaklaşımı bu mu? Değilse, lütfen açıklayın ...

    (1) 'e verilen cevabın "evet" olduğunu varsayarsak, o zaman kafam karıştı, çünkü DTW sonucu a) eğrilerin genliklerindeki fark ve b) sorgu vektörünün uzunluğu ve " şablon "vektör.

    Simetrik adım fonksiyonu kullanıyorum, bu yüzden (b) için DTW sonucumu M + N'ye (DTW matrisinin genişlik + yüksekliği) bölerek normalleştiriyorum. Bu biraz etkili gibi görünüyor, ancak diyagonalden daha fazla olan (yani DTW matrisinde daha uzun bir yolu olan) DTW maçlarını cezalandıracak gibi görünüyor. Bu bir "normalleşme" yaklaşımı için keyfi gibi görünüyor. Matris boyunca adım sayısına bölünmek sezgisel bir anlam gibi görünüyor, ancak literatüre göre bunu yapmanın yolu görünmüyor.

  2. DTW sonucunu, sorgu ve şablon vektörlerinin boyutu için ayarlamanın daha iyi bir yolu var mı?

  3. Son olarak, sorgu ve şablon vektörleri arasındaki genlikler arasındaki fark için DTW sonucunu nasıl normalleştirebilirim?

Olduğu gibi, güvenilir normalleştirme tekniklerinin eksikliği (veya benim anlayış eksikliğim) göz önüne alındığında, bir "eşleşme" tanımlamak için en iyi eşik seviyesini belirlemek için örnek verilerle çalışma konusunda çok fazla manuel çaba var gibi görünüyor. Bir şey mi kaçırıyorum?

Yanıtlar:


8

En azından bilgime göre bunun için "genel bir yaklaşım" yoktur. Ayrıca yine de bir mesafe metriğini en aza indirmeye çalışıyorsunuz. Örneğin DTW gazetelerinin büyükbabasında Sakoe & Chiba (1978) kullanın||birben-bben|| iki özellik vektörü arasındaki farkın ölçülmesi.

Doğru bir şekilde belirlediğiniz gibi, bunun kutunun dışında çalışması için aynı sayıda noktaya (genellikle) sahip olmanız gerekir. İlk önce eşit boyutta yapmak için eğrilerinizde bir lowess () pürüzsüz / enterpolatör kullanmanızı öneririm. "Eğri istatistikleri" için oldukça standart şeyler. Sen örnek bir uygulama görebilirsiniz Chiou ve arkadaşları. (2003) ; yazarlar bu çalışmada DTW'yi umursamıyorlar, ancak eşit olmayan boyutlardaki okumalarla nasıl başa çıkılacağı iyi bir örnektir.

Ayrıca "genlik" dediğiniz gibi bir sorundur. Dürüst olmak gerekirse bu biraz daha açık uçlu. Zhang ve Mueller (2011) tarafından bununla ilgilenmek için önerilen Eğri Altında bir Alan yaklaşımını deneyebilirsiniz, ancak gerçekten de normal norm normalleştirmeyi bile çarpıtmak amacıyla (yani,f(x) ile f(x)supy|f(x)|Tang ve Mueller (2009) tarafından bu yazıda olduğu gibi . İkincisini takip ederdim, ama her durumda da örneklerin normalleşmesinin bir zorunluluk olduğunu fark ettiniz.

Verilerinizin niteliğine bağlı olarak, uygulamaya özgü daha fazla literatür bulabilirsiniz. Şahsen hedef çift çözgü fonksiyonuna göre minimize etme yaklaşımını buluyorumgen sezgisel. Yani en aza indirmek için hedef işlevi: Cλ(Yben,Yk,g)=E{T(Yben(g(t))-Yk(t))2+λ(g(t)-t)2dt|Yben,Yk}, teknesine rağmen her şey aslında oldukça basittir: çözgü fonksiyonunu bulmaya çalışın g çarpık sorgu eğrisinin uyumsuzluğunun beklenen toplamını en aza indiren Yben(g(t)) referans eğrisine Yk(t) (dönem Yben(g(t))-Yk(t)) bu çarpıtma ile empoze ettiğiniz zaman-çarpıklığa göre normalleşmeye tabidir (terim g(t)-t). PACE MATLAB paketi bunu uyguluyor. JO Ramsay vd. Tarafından bir R paketi fda olduğunu biliyorum . bu da yardımcı olabilir ama kişisel olarak kullanmadım (bu paketin yöntemleri için biraz can sıkıcı bir standart referans çoğu durumda Ramsay ve Silverman'ın mükemmel kitabı, Fonksiyonel Veri Analizi (2006) 2. baskı. ve bir Aradığınızı almak için 400 sayfalık kitap; en azından yine de iyi okumak)

İstatistik literatüründe tanımladığınız sorun yaygın olarak " eğri kaydı " olarak bilinir (örneğin , sorunun erken tedavisi için Gasser ve Kneip (1995) 'e bakınız ) ve Fonksiyonel Veri Analizi tekniklerinin genel şemsiyesi altındadır .

(Orijinal belgeyi çevrimiçi olarak bulabildiğim durumlarda bağlantı oraya yönlendirir; aksi takdirde bağlantı genel bir dijital kütüphaneye yönlendirilir. Bahsedilen makalelerin neredeyse tamamı ücretsiz sürümleri taslak olarak bulunabilir. Orijinal yorumumu olduğu gibi sildim bu yayının yerini aldı.)


Bu mükemmel ve çok çok yardımcı bir cevaptır. Referanslar özellikle yararlıdır.
Mikko

DTW'de "genlik bir sorundur" olduğunu belirten uygun bir başvuru biliyor musunuz? Bu muhtemelen o kadar açıktır ki, bu konuda açıkça tartışan bir referans bulmak için mücadele ediyorum.
Mikko

Beğenmene sevindim. Dediğim gibi genlik tedavisi "biraz daha açık uçlu" ve söz konusu uygulama veya metodoloji ile ilgili olmadıkça (örneğin Zhang & Mueller'in çalışmasında olduğu gibi) tek bir referans bulacağınızı sanmıyorum. 09). Farklı birimlerde ölçülen verileriniz varsa normalleştirme gereklidir. Genellikle çok önemli olan, fonksiyonel ana / kanonik / what_have_you bileşenlerinin normalleştirilmesidir, böylece bunlarL2.
usεr11852

Bahsedilen kaynaklardan muhtemelen en iyi bahsiniz muhtemelen Ramsay & Silverman, Chapt'ın FDA kitabı olacaktır. 7 "işlevsel verilerin kaydedilmesi ve görüntülenmesi" hakkında. Çok iyi bir kaynak da kitaptır: Horváth ve Kokoszka'nın "Uygulamalarla Fonksiyonel Veriler İçin Çıkarım"; Bölüm III "Bağımlı fonksiyonel veriler" normalleşme konusuna değinmektedir çünkü çoğunlukla değişim noktası tespitini önemsemektedir.
usεr11852
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.