Uzamsal-zamansal tahmin hatalarının açıklayıcı analizi


13

Veriler: Son zamanlarda, rüzgar enerjisi üretim tahmin hatalarının uzaysal-zamansal alanının stokastik özelliklerini analiz etmek için çalıştım. Resmi olarak, bir işlem iki kez ( ve ) dizinlenmiş ve bir kez boşluk ( ) içinde ileriye doğru bakma sayısıdır (etrafındaki bir şeye eşittir) , düzenli olarak örneklenir), "tahmin sürelerinin" sayısıdır (yani, tahminin yayınlandığı zamanlar, benim durumumda 30000 civarında, düzenli olarak örneklenir) ve thpH24Tn

(ϵt+h|tp)t=1,T;h=1,,H,p=p1,,pn
thpH24Tnbir dizi uzamsal pozisyon olmak (ızgarasız, benim durumumda yaklaşık 300). Bu hava ile ilgili bir süreç olduğu için kullanılabilecek çok sayıda hava tahmini, analiz, meteorolojik ölçümüm var.

Soru: İnce bir modelleme önermek amacıyla sürecin karşılıklı bağımlılık yapısının doğasını (doğrusal olmayabilir) anlamak için bu tür veriler üzerinde yapacağınız keşif analizini tarif edebilir misiniz?


bu çok ilginç bir soru. En azından anonimleştirilmiş verilerin bir alt kümesiyle oynamak mümkün mü? Tahminler nasıl oluşturuldu, ne tür bir model kullanıldı?
mpiktas

1
@mpiktas teşekkürler, uygun bir AR modellemesi (her rüzgar çiftliği için bir tane) ile oluşturulduğunu düşünebilirsiniz, sorunu çok fazla değiştirmez. Maalesef, bu verilerle ilgili çok fazla güven sorunu var, size hiçbir şey sağlayamıyor, hatta anonimleştirilmiş ...
robin girard

Yanıtlar:


6

Bana öyle geliyor ki, hem tahmin hatalarının yanlılığının (yani [ilk anı] sistematik olarak aşırı / az tahmin etme eğilimi) hem de varyanslarının [ikinci anı] uzay-zaman ve meteorolojik etkilerine olan bağımlılığı modellemek için yeterli veriye sahipsiniz.

Yanlılığı araştırmak için, çok fazla dağılım grafiği, ısı haritası veya altıgen grafikleri yapardım. Değişkenliği araştırmak için, orijinal hataları karelerim ve daha sonra bir çok dağılım grafiği, ısı haritası veya altıgen grafikleri yapardım. Çok fazla önyargınız varsa, bu elbette tamamen sorunsuz değildir, ancak yine de ortak değişkenli heteroskedastisite modellerini görmeye yardımcı olabilir.

Benim Meslektaşlarım da iyi bir sahip modellerin bu tür (gerekirse de, daha yüksek anları modelleme için sağlar) uydurma için çok esnek bir yöntem detayları güzel techreport yaptılar Rşekillerde gerçekleştirebileceklerdir gamboostLSS dayalı mboost: Mayr, Andreas; Fenske, Nora; Hofner, Benjamin; Kneib, Thomas ve Schmid, Matthias (2010): Yüksek boyutlu veriler için GAMLSS - güçlendirmeye dayalı esnek bir yaklaşım. . Çok fazla RAM'e sahip makinelere erişiminiz varsa (veri kümeleriniz BÜYÜK görünüyor), her türlü yarı parametrik etkiyi tahmin edebilirsiniz (mekansal etkiler için pürüzsüz yüzey tahmin edicileri veya ve ortak etkisi gibi)hth, tensör ürün tempo-mekansal etkiler için eğri çizgiler veya meteorolojik etkilerin yumuşak etkileşimleri vb.) farklı şekillerde aynı anda terim seçimini yapabilir ve aynı zamanda eşzamanlı ve yorumlanabilir bir model elde etmek için terim seçimini gerçekleştirebilir. Umut, bu modeldeki terimlerin tahmin hatalarının spatio-temporal otokorelasyon yapısını hesaba katmak için yeterli olması olabilir, ancak muhtemelen bu modellerin kalıntılarını otokorelasyon için kontrol etmelisiniz (yani bazı variogramlara ve ACF'lere bakın).


+1 Teşekkürler Fabians, Tamamen haklısın, sorun yeterli veriye sahip olmamam değil. Sorumun özellikle bağımlılık yapısı ile ilgili olduğunu unutmayın. Dağılım grafikleri, ısı haritaları ve altıgen çizim, iyi bir amaç için kullanılıyorsa iyi araçlardır. Genel katkı modelinin de çok güçlü olabileceğini düşünüyorum, Brillinger'in GAM'ın nasıl kullanılacağına dair iyi ipuçları veren harika bir kağıdı var.
robin girard

5

Biz (bir meslektaşım ve ben) nihayet bu konuda bir makale yazdık. Bazı şeyleri özetlemek için, hataların Danimarka boyunca ve ileriye dönük olarak (spatio-temporal) yayılımını ölçmek ve istatistiksel bir özetini sunmak için iki çözüm önerdik.

  • İlkinde biz rüzgar çiftliklerinin tüm çiftleri arasında ve göz önde kez tüm çiftleri (bu 4 değişkenlerin bir fonksiyonudur) için korelasyonun hesaplanması. Bir çift sabitlendiğinde, korelasyon fonksiyonunun ileriye doğru bakıldığında yerel bir maksimuma sahip olduğunu gösterdik, bunun yayılma olduğunu söyledik! Belirli bir rüzgar çiftliği çiftiyle ilişkili zamansal ölçek, bu yerel maksimumun elde edildiği zamansal gecikme tarafından verilir. Tüm rüzgar çiftliği çiftleri için, korelasyonun yerel maksimumunu, bunu elde etmeyi sağlayan zamansal gecikmeyi ve rüzgar çiftliklerine katılan uzamsal vektörü çizmek, Şekil 1'in sağ tarafını verir.

Şekil 1

Bu, küresel bir yayılma vektörünü hesaplamak için kullanılabilir, yani çiftler arasındaki yayılma hızlarının bir tür uzamsal ortalaması. Bunun bir kısmı Şekil 1'in sol tarafında gösterilmektedir ve hangi hataların yayılmasının Denamrk'ta Batı Doğu olduğunu tahmin edin (tamam, bu büyük bir sürpriz değildi :)). Ayrıca, yayılım ve rüzgar (hız, yön) arasındaki ilişkiyi göstermek için bunu şartlı olarak farklı meteorolojik durumlara göre analiz ettik.

  • İkincisi, birincisine diktir (aslında :)). Her bir zaman için biz sürekli yayılma hızına sahip bir uzay-zaman (alan ve görünüm önde kez birlikte) Düzlemsel dalga modeli ile donatılmış. Bu, tahmin süresi başına bir yayılma hızı verir (ve , düzlemsel dalga modeli tarafından elde edilen uyumun kalitesini ölçer). Daha sonra bu hızlarla ilgili istatistikleri hesaplayabilir, sonunda düzlemsel dalga uyumunun iyi olduğu durumlarla sınırlayabilirsiniz. Sonuçlar Şekil 2'de görülmektedir.t R 2ttR2

şekil 2

İkinci durumda, zamansal ortalama yayılma hızının birinci durumda uzamsal ortalama ile elde edilene benzer bir büyüklüğe sahip olduğunu gözlemledik. Bu işe daha ciddi bakmak istiyorsanız, kağıt burada .


+1 Paylaştığınız için teşekkürler. (Özür dilerim soruyu ilk ortaya çıktığında kaçırdım.) Çapraz variogramları ileriye dönük olarak çizmeyi düşündünüz mü? En etkili olanlar geleneksel yumuşatılmış yönlü variogram bulutları olmazdı; bunun yerine, variogram bulut yoğunluklarının iki boyutlu grafiklerini kullanın. Daha sonra zamansal ilişkileri keşfetmek için bunların çapraz variogramlarını oluşturabilirsiniz . Yayılma sonuçlarınız otomatik olarak böyle bir analizden çıkmalıdır.
whuber

@whuber Yorum için teşekkürler, bu sitede 2 veya 3'ten fazla soruyu kaçırdığınıza inanmıyorum :). Variogramm ile ilgili fikriniz bağlantılı görünüyor (variogram kullanmak için çok fazla kullanmıyorum, genellikle variogram ile formüle edilebilen her şeyin kovaryanslarla pratik bir eşdeğeri olduğuna inanıyorum ...), düşüneceğim.
robin girard

Birçok uygulamada kovaryansların variogramlara eşdeğer olduğu doğrudur. Bununla birlikte, variogram bulutu, yalnızca kovaryans fonksiyonları ile çalışmanın sunduğu görünmeyen hem görsel hem de kavramsal bir ek sağlar - biraz, sadece korelasyon matrisleri yerine dağılım grafiklerine bakmak gibi: bazen sayıların açıkça ortaya koymadığı desenleri görebilirsiniz .
whuber
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.