Çevresel verilere dayalı mahsul verimlerini tahmin etmek için bir makine öğrenme modeli oluşturmak


10

10 yıldır (2005 - 2014) bir çiftlik için sıcaklık, yağış ve soya fasulyesi verimi hakkında veri içeren bir veri setim var. Bu verilere dayanarak 2015 yılı getirilerini tahmin etmek istiyorum.

Veri kümesinin sıcaklık ve yağış için GÜNLÜK değerlere sahip olduğunu, ancak verim için yılda sadece 1 değere sahip olduğunu unutmayın, çünkü mahsulün hasadı, mahsulün büyüme mevsiminin sonunda gerçekleşir.

Önceki yıllarda verim ile sıcaklık ve yağış arasındaki ilişkiyi inceleyerek elde edilen bir regresyona / başka bir modele dayanarak 2015 verimlerini tahmin etmek için bir regresyon veya başka bir makine öğrenimi tabanlı model oluşturmak istiyorum.

Scikit-learn'u kullanarak makine öğrenimi yapmaya aşinayım. Ancak, bu sorunun nasıl temsil edileceğinden emin değilim. Buradaki zor kısım, sıcaklık ve yağışın günlük olmasına rağmen verimin yılda sadece 1 değer olmasıdır.

Buna nasıl yaklaşırım?


hatta mahsul verimini tahmin etmek için bir model oluşturmaya çalışıyorum. Takip ettiğiniz yaklaşımla ilgili ayrıntıları paylaşır mısınız?
Nitz

Tam bir cevap alabildiniz mi? Hayır ise, lütfen bana bildirin ve aynı alanda çalıştığımdan nasıl devam edileceğime dair ayrıntılı bir cevap yazmaktan mutluluk
duyarım

@ Crop89, bu harika olurdu! Cevabınızı dört gözle bekliyoruz
user308827

Anladın mı? Aynı sorunla karşı karşıyayım. Çalışırsanız ayrıntıları paylaşır mısınız? çok teşekkürler
eric huang

Yanıtlar:


3

Yeni başlayanlar için, bir önceki yılın günlük verilerine dayanarak önümüzdeki yılın verimini tahmin edebilirsiniz. Model parametrelerini her yılın veri değerini tek bir "nokta" olarak değerlendirerek tahmin edebilir, ardından modeli çapraz doğrulamayı kullanarak doğrulayabilirsiniz. Bu modeli geçen yıldan daha fazla düşünerek uzatabilirsiniz, ancak çok geriye bakın ve modelinizi ve donanımınızı doğrulamakta sorun yaşarsınız.


Teşekkürler @Emre, karışıklığım, bir yılın tüm verilerini 1 puan olarak nasıl ele alacağım? Her bir veri satırı (bir günü temsil eder) scikit-learn terminolojisinde örnek teşkil etmez mi? Bir yıl boyunca 365 yerine bir örnek olarak nasıl davranırım?
user308827

1
Ben sklearn özelliklerini ele değildi, ama sorduğunuzdan beri sklearn.cross_validation, adında "Etiket" ile, sklearn.cross_validation.LabelKFold gibi yöntemleri kullanmak istiyorsunuz .
Emre

teşekkürler @Emre, bu yüzden fikir her yıl tek bir etiket atamak, değil mi?
user308827

Evet, @ user308827.
Emre

Tekrar teşekkürler @Emre, lütfen takip eden soruya bir göz atın: datascience.stackexchange.com/questions/9612/…
user308827


1

Her veri noktası 365 (her gün için sıcaklık) + 365 (her gün için yağış) boyutlarına sahip 10 veri noktanız vardır. İdeal olarak, önce PCA gibi makine öğrenme yöntemleri ile boyutları küçültürdüm. Ardından bir tahmin modeli oluşturmak için makine öğrenme yöntemlerini kullanın. Ancak, küçük veri kümesi nedeniyle, makine öğrenme tekniklerinin sorununuza uygun olduğunu düşünmüyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.