Doğrusal regresyonda dairesel öngörücülerin kullanımı


19

Rüzgar verilerini (0, 359) ve günün saatini (0, 23) kullanarak bir model yerleştirmeye çalışıyorum, ancak kendilerinin doğrusal parametreler olmadıkları için doğrusal bir regresyona zayıf bir şekilde sığacaklarından endişeliyim. Onları Python kullanarak dönüştürmek istiyorum. En azından rüzgar durumunda, bir sürü değil, derecelerin günahını ve cos'unu alarak bir vektörün hesaplanmasından bahsetmiştim.

Yararlı olabilecek bir Python kütüphanesi veya ilgili yöntem var mı?


1
Bunu bir soru olarak sorduğunuz için teşekkür ederiz. Kod veya kitaplık istemenin konu dışı olduğunu (sorunuzun büyük bir kısmı kesinlikle konuyla ilgilidir), bu yüzden bu yönün buradaki yanıtlarla kapsanabileceğini veya olmayabileceğini unutmayın.
gung - Monica'yı eski

Burada yanıt değişkeni (sonuç, bağımlı değişken) nedir? Rüzgar yönü ve günün saati her iki belirteç midir?
Nick Cox

@NickCox Evet, hem rüzgar yönü hem de günün saati tahmin edicidir. Sonuç, partikül konsantrasyonunu (hava kirliliği) temsil eden bir tamsayı değeridir. Sıcaklık, nem, vb. Gibi başka öngörücüler de var ... ama bunların dönüştürülmesine gerek olmadığını düşünüyorum.
compguy24

1
Başlığı düzenleme özgürlüğünü aldım. Önceki başlık "Bir dairenin etrafındaki derecelerin doğrusal dağılımı" benim görüşüme göre soruyu hiç yakalamadı.
Nick Cox

Yanıtlar:


24

Rüzgar yönü (burada derece cinsinden ölçülen, muhtemelen kuzeyden saat yönünde pusula yönü olarak) dairesel bir değişkendir. Test, ölçeğin geleneksel başlangıcının sonla aynı olmasıdır, yani . Bir prediktör olarak tedavi edildiğinde muhtemelen en iyi sinüs ve kosinüs ile eşlenir. Yazılımınız ne olursa olsun, açıların radyan cinsinden ölçülmesi beklenir, bu nedenle dönüşüm,0=360

sin(π direction/180),cos(π direction/180)

verilen radyan . Benzer şekilde gece yarısından itibaren saatler cinsinden ölçülen günün zamanı, sinüs ve kosinüs ile eşlenebilir.2π=360

sin(π time/12),cos(π time/12)

veya

sin(π(time+0.5)/12),cos(π(time+0.5)/12)

tam olarak zamanın nasıl kaydedildiğine veya yorumlanmasına bağlı olarak.

Bazen doğa ya da toplum zorunludur ve dairesel değişkene bağımlılık, tepki için en uygun olan ve ters yönde (dairenin yarısı kadar) soluk olan bir yön şeklini alır. Bu durumda tek bir sinüs ve kosinüs terimi yeterli olabilir; daha karmaşık desenler için başka terimlere ihtiyacınız olabilir. Çok daha fazla ayrıntı için, bu dairesel, Fourier, periyodik, trigonometrik regresyon tekniğiyle ilgili bir öğretici burada bulunabilir ve daha sonra referanslar da bulunabilir. İyi haber şu ki, sinüs ve kosinüs terimleri oluşturduktan sonra, regresyonunuzda sadece ekstra tahmin edicilerdir.

Dairesel istatistiklerle ilgili, kendisi yön istatistiklerinin bir parçası olarak görülen büyük bir literatür vardır. Garip bir şekilde, literatürde genellikle dairesel yanıt değişkenleri üzerinde durulduğu için, bu teknik genellikle belirtilmez. Dairesel değişkenleri vektör araçlarıyla özetlemek standart bir tanımlayıcı yöntemdir, ancak regresyon için gerekli değildir veya doğrudan yardımcı değildir.

Terminoloji ile ilgili bazı ayrıntılar Rüzgar yönü ve günün saati, bilim dalınızdaki kullanım ne olursa olsun, parametreler değil istatistiksel terimlerdir.

Doğrusal regresyon bir vektör için parametreleri doğrusallık örneğin, ile tanımlanır tarafından tahmin bu parametrelerin vektörüdür değil, öngördürücülerin matris daha önemlidir. Dolayısıyla, bu durumda, sinüs ve kosinüs gibi öngörücülerin dairesel ölçeklerde ölçülmesi ve aynı zamanda ile sınırlandırılması , lineer regresyonda görünmelerinin önünde bir engel oluşturmaz.X β β X [ - 1 , 1 ]yXββX[1,1]

Arızi yorum Parçacık konsantrasyonu gibi bir yanıt değişkeni için, pozitif tahminler sağlamak için logaritmik bağlantılı genelleştirilmiş doğrusal bir model kullanmayı beklerdim.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.