Facebook Peygamber doğrusal bir regresyondan farklı mıdır?


11

Facebook'un peygamberi hakkında okuduğum şey , temel olarak zaman serilerini trend ve mevsimsellikten ayırıyor. Örneğin, bir katkı modeli şu şekilde yazılabilir:

y(t)=g(t)+s(t)+h(t)+et

ile

  • t zaman
  • g(t) eğilim (doğrusal veya lojistik olabilir)
  • s(t) mevsimsellik (günlük, haftalık, yıllık ...)
  • h(t) tatiller
  • et hata

Sorularım: Basit bir doğrusal regresyon ile yapılamaz mı? Sonuçları karşılaştırırsak sonuç açısından farklılıklar neler olurdu ve neden?


Evet bunu doğrusal bir modelle yapabilirsiniz. Peygamber'i tanımıyorum ama eğer yaptığı tek şey buysa, o zaman hiçbir fark yoktur.
user2974951

Yanıtlar:


13

Buradaki sorun, gözlemlenen verileri sinyal ve gürültüye ayıran bir denkleme ulaşmaktır. Verileriniz basitse, regresyon yaklaşımınız işe yarayabilir. Peygamber ile yaptıkları varsayımları anlamaya özen gösterilmelidir. Peygamber'in ne yaptığını daha iyi anlamalısınız, çünkü sadece basit bir modele uymakla kalmaz, aynı zamanda bir yapı eklemeye çalışır.

Örneğin, iyi yazılmış tanıtımlarını okuduktan sonra yaptığım bazı düşünceler değerlendirmenize yardımcı olabilir. Eğer yaklaşımlarını yanlış anladıysam, özür dilerim ve eğer düzeltilmeyi istiyorum.

1) Başlıca örneklerinin trendde iki kırılma noktası vardır, ancak yalnızca en belirgin olanı yakalarlar.

2) Atlanan stokastik seriyi veya Y'nin tarihsel değerlerini öngörmeyi yönlendirmek için kullanmanın değerini yansıtan tüm ARIMA yapılarını göz ardı ederler.

3) Kullanıcı tarafından önerilen stokastik ve deterministik serilerin olası dinamiklerini (kurşun ve gecikme etkileri) göz ardı ederler. Peygamber'in nedensel regresyon etkileri basitçe çağdaştır.

4) Serideki veya mevsimsel darbelerde adım / seviye kaymalarını tanımlamak için hiçbir girişimde bulunulmamaktadır, örneğin, bilinmeyen bazı dış olaylar nedeniyle PAZAR ETKİSİNİN yarısında bir değişiklik. Peygamber, alternatif olasılıkları inceleyerek doğrulamak yerine "basit doğrusal büyüme" varsaymaktadır.Bunun olası bir örneği için, Facebook Prophet ve R kullanarak bir çevrimiçi abonelik işletmesi için yinelenen siparişleri tahmin etme bölümüne bakınız.

5) Sinüsler ve Kosinüsler mevsimsellik ile başa çıkmanın opak bir yoludur; haftanın günü, ayın günü, ayın haftası, yılın ayı gibi mevsimsel etkiler antropojenik (insanlarla uğraşmak!) etkilerle uğraşırken çok daha etkili / bilgilendirici.

Yıllık kalıplar için 365,25 sıklık önermek çok mantıklı değildir, çünkü geçen yıl yaptığımızla aynı gün aynı eylemi gerçekleştirmiyoruz, ancak aylık aktivite çok daha kalıcı, ancak Peygamber 11 aylık göstergeleri sunmuyor gibi görünüyor seçeneği. Haftalık 52 sıklığı çok mantıklı değil çünkü her yıl 52 haftamız yok.

6) Gaussian hata süreçlerini doğrulamak için hiçbir girişimde bulunulmaz, böylece anlamlı anlamlılık testleri yapılabilir.

7) Model hatası varyansının homojen olması endişesi yoktur, yani Ağırlıklı En Küçük Kareler'i düşündüren belirli noktalarda deterministik olarak değişmemek. Hata varyansının Beklenen Değer ile orantılı olmasını sağlamak için optimal bir güç dönüşümü bulma endişesi yok Ne zaman (ve neden) bir dağılım günlüğünü (sayıların) almalısınız? .

8) Kullanıcı, etkinlikler / tatil günlerinde olası tüm olası satış ve gecikme etkilerini önceden belirtmelidir. Örneğin, günlük satışlar genellikle Noel'in uzun vadeli etkisini yansıtan Kasım ayı sonlarında artmaya başlar.

9) Ortaya çıkan hataların yapıdan muaf olması, yeterlilik için teşhis kontrolü yoluyla modeli geliştirmenin yollarını önermektedir.

10) Görünüşe göre, anlamlı olmayan yapıyı silerek modelin geliştirilmesi ile ilgili bir endişe yok.

11) Modelin hatalarını olası anormalliklere izin vererek önyükleme yoluyla güven sınırlarının mutlaka simetrik olmayabileceği simüle edilmiş tahminler ailesi elde etmek için bir tesis yoktur.

12) Kullanıcının trendler (varsayım kesme noktaları ve gerçek kesme noktaları #) hakkında varsayımlar yapmasına izin vermek, adıyla eller serbest büyük ölçekli uygulamalar için tasarlanmış olan büyük ölçekli analiz karşısında istenmeyen / kullanılamaz esneklik sağlar.


Kabul ediyorum, ama bu şeylerin "olması güzel" özelliklere daha yakın olduğunu söyleyebilirim, o zaman "olması gerekir". Bazıları olmayan yüksek kaliteli tahmin modellerine sahip olabilirsiniz. Ama, dediğim gibi, iyi noktaları ve güzel bir daha gözden geçirme.
Tim

Yansımanızda oldukça haklısınız ... "verinin" doğasında var olan karmaşıklık iktidar konusudur. Basit veri .. basit çözümler .. karmaşık veriler "sahip olmak güzel" olabilir "olması gerekir" haline düşündürmektedir. Sadece verileriniz kesin olarak bilir! Occam'ın ustura akla geliyor ..
IrishStat

@Tim stats.stackexchange.com/questions/417908/… evre, "olması hoş" olan bazı özelliklerin "basit doğrusal eğilim" gibi uygunsuz varsayımları geçersiz kılmak için gerçekte "olması" gerektiğini önermektedir.
IrishStat

10

Ben kullanmadım, ama bu onların baskı öncesi soyut (benim vurgu):

Tahmin, kuruluşlara kapasite planlama, hedef belirleme ve anormallik tespiti konularında yardımcı olan yaygın bir veri bilimi görevidir. Önemine rağmen, güvenilir ve kaliteli tahminler üretmeyle ilgili ciddi zorluklar vardır - özellikle çeşitli zaman serileri olduğunda ve zaman serileri modellemesinde uzman analistler nispeten nadirdir . Bu zorlukların üstesinden gelmek için, yapılandırılabilir modelleri döngü içi analist performans analiziyle birleştiren “ölçekli” öngörmede pratik bir yaklaşım açıklanmaktadır. Zaman serileri hakkında alan bilgisi olan analistler tarafından sezgisel olarak ayarlanabilen yorumlanabilir parametrelerle modüler bir regresyon modeli öneriyoruz. Tahmin prosedürlerini karşılaştırmak ve değerlendirmek için performans analizlerini açıklıyor ve manuel inceleme ve ayarlama için tahminleri otomatik olarak işaretliyoruz. Analistlerin uzmanlıklarını en etkin şekilde kullanmalarına yardımcı olan araçlar, iş zamanı serilerinin güvenilir ve pratik olarak öngörülmesini sağlar.

Giriş bölümünde:

İş tahminleri oluşturma pratiğinde iki ana tema gözlemledik. İlk olarak, tamamen otomatik öngörme tekniklerinin ayarlanması zor olabilir ve genellikle yararlı varsayımları veya sezgisel bilgileri içeremeyecek kadar esnek değildir. İkincisi, bir kuruluştaki veri bilimi görevlerinden sorumlu analistler, genellikle destekledikleri belirli ürünler veya hizmetler hakkında derin bir alan uzmanlığına sahiptir, ancak çoğu zaman zaman serisi tahmini konusunda eğitim almazlar.

Bana öyle geliyor ki, burada önemli bir istatistiksel ilerleme kaydettiklerini iddia etmiyorlar (ana hatlarıyla anlattığınız basit modelden çok daha fazlasını yapabiliyor olsa da). Bunun yerine, sistemlerinin kendi alan uzmanlıklarını ve sisteme özgü kısıtlamaları uygularken tahminler oluşturmasını sağlayacak zaman serileri analizinde uzman olmayan çok sayıda insan için mümkün olduğunu iddia ediyorlar.

Hem zaman serisi analizlerinde hem de karmaşık modellerin kodlanmasında uzmanlığınız varsa, bu sizin için çok yararlı olmayabilir. Ancak iddiaları doğruysa, bu son derece yararlı olabilir! Bilim (ve ticaret) sadece yeni fikirler değil, aynı zamanda yeni araçlar ve bunların yayılması nedeniyle de ilerlemektedir ( konu ve bu yanıt hakkındaki bu kısa Freeman Dyson parçasına bakın ).

İstatistiklerin kendisinden bir örnek almak: Ristatistiksel bir ilerlemeyi temsil etmedi, ancak çok etkili oldu, çünkü çok daha fazla insanın istatistiksel analiz yapmasını kolaylaştırdı. Çok sayıda istatistiksel anlayışın üzerine inşa edildiği iskele olmuştur. Eğer şanslıysak Peygamberimiz de benzer bir rol oynayabilir.

Dyson, Freeman J. "Bilim çoğunlukla fikirlerden mi yoksa araçlardan mı kaynaklanıyor?" Science 338, no. 6113 (2012): 1426-1427.


0

Doğrusal modellerde uygulanabilen değişim noktalarını, parçalı doğrusal eğrileri kaçırıyorsunuz.

En azından sınırlayıcı durumda doğrusal bir regresyon (L1 ve L2 regülasyonu) olduğu konusunda haklısınız.

Ayrı bir peygamber modeli, lojistik büyüme olduğunu unutmayın.

Ayrıca mevsimsel faktörlerin katkı maddesi olduğunu varsayıyorsunuz, ancak en azından büyüme modellemesi için daha doğal görünen çarpıcı mevsimsel etkileri de destekliyorlar.


Kütük almanın peygamber varsayımı, bu değerli tartışma karşısında uçuyor ... stats.stackexchange.com/questions/18844/… Beklenen Değer ile model hata değişimi arasındaki ampirik bir ilişkiye veya belirli bir özelliğe dayanarak güç dönüşümlerinin haklı olduğu etki alanı bilgisine dayanmayan doğrusal olmayan varsayım.
IrishStat

@IrishStat Bu nokta için teşekkür ederim (Çarpıcı mevsimselliği uygulamak için dönüşümü günlüğe kaydettiklerini unutmuştum, STAN kullanıyorlar, bu yüzden günlükleri almak yerine doğrusal olmayan bir model kullanabileceklerine inanıyorum).
Çarpıcı

@ Whuber'ın answer stats.stackexchange.com/questions/298/… adresine bakarsanız, "bilimsel teori," alan adı bilgisine dayanan olası doğrusal olmayan bir varsayım olacağını gösterdiğinde "dönüşümler önerir. Ampirik Güç dönüşümleri, hataların varyansının beklenen değerle orantılı olduğu tespit edildiğinde yararlıdır, aksi takdirde basitçe "pencere giydirme" olabilir.
IrishStat

0

Basit bir lineer regresyon ile çok şey yapılabilir, ancak Peygamber'in yaptığı gibi değil. Sadece bir örnek, bir değişim için kendi değişiklik noktası adayınızı belirtebilirsiniz ve Peygamber bunu bir öncekiler olarak kullanacaktır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.