Havayollarının fiyat belirleme davranışını - özellikle havayollarının rakiplerin fiyatlandırmasına nasıl tepki verdiğini araştırmak istiyorum.
Daha karmaşık analiz hakkındaki bilgimin oldukça sınırlı olduğunu söyleyeceğim gibi, verilerin genel bir görünümünü toplamak için çoğunlukla tüm temel yöntemleri yaptım. Bu, benzer desenleri tanımlamaya zaten yardımcı olan basit grafikler içerir. Ayrıca SAS Enterprise 9.4 kullanıyorum.
Ancak daha sayı tabanlı bir yaklaşım arıyorum.
Veri Kümesi
Kullandığım (kendi kendine) toplanan veri seti yaklaşık ~ 54.000 ücret içeriyor. Tüm ücretler günlük olarak (her gece 00: 00'da) 60 günlük bir zaman aralığı içinde toplanmıştır.
Bu nedenle, bu zaman penceresindeki her ücret , ücretin mevcudiyetine ve uçuşun kalkış tarihine göre geçtiği uçuşun kalkış tarihine bağlı olarak kez gerçekleşir . (Uçuşun kalkış tarihi geçmişte olduğunda uçuş için ücret alamazsınız)
Temelde şuna benzeyen biçimlendirilmemiş: (sahte veriler)
+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32 | 16APR2015:10:50:02 | 23APR2015:21:55:04 | XA |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32 | 16APR2015:13:20:02 | 23APR2015:19:00:04 | XY |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32 | 16APR2015:13:20:02 | 23APR2015:21:55:04 | XH |
+--------------------+-----------+--------------------+--------------------------+---------------+
İle hesaplanan "DaysBeforeDeparture" burada
- I ve aralık (kalkıştan günler önce)
- s & ücret tarihi (uçuş kalkış)
- c & ücretin alındığı tarih
İşte I (DaysBeforeDep.) (Sahte veriler!) Tarafından ayarlanmış gruplandırılmış verilere bir örnek:
+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 880.68 | 477.99 | 2,245.23 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 904.89 | 477.99 | 2,534.55 | DL |
+-----------------+------------------+------------------+------------------+------------------+
| 0 | 1,044.39 | 920.99 | 2,119.09 | LH |
+-----------------+------------------+------------------+------------------+------------------+
Şimdiye kadar ne buldum
Çizgi grafiklere baktığımda, birkaç çizginin yüksek korelasyon faktörüne sahip olacağını zaten tahmin edebilirim. Bu nedenle, önce gruplandırılmış veriler üzerinde korelasyon analizi kullanmaya çalıştım. Ama bu doğru yol mu? Temel olarak şimdi bireysel fiyatlar yerine ortalamalar üzerinde korelasyon yapmaya çalışıyorum? Başka bir yol var mı?
Fiyatlar herhangi bir doğrusal formda hareket etmediği ve doğrusal olmadığı göründüğü için, hangi regresyon modelinin buraya uyduğundan emin değilim. Bir havayolunun fiyat gelişmelerinin her birine bir model yerleştirmem gerekir mi?
Not: Bu uzun bir metin duvarı. Bir şeyi açıklığa kavuşturmam gerekirse bana bildirin. Bu alt bölümde yeniyim.
Bir ipucu var mı? :-)