(Doğrusal Regresyon) Tahmininde Düzenlemeler


11

Tam açıklama: Ben bir istatistikçi değilim, ne de bir iddiada bulunuyorum. Ben düşük bir BT yöneticisiyim. Lütfen benimle nazik oynayın. :)

Kuruluşumuz için disk depolama kullanımını toplamak ve tahmin etmekten sorumluyum. Depolama kullanımımızı aylık olarak toplarız ve tahminler için basit bir yuvarlanan on iki aylık doğrusal regresyon kullanırız (başka bir deyişle, bir projeksiyon yaparken yalnızca önceki on iki aylık veriler dikkate alınır). Bu bilgileri tahsis ve sermaye gideri planlaması için kullanıyoruz, örneğin "Bu modele dayanarak, ihtiyaçlarımızı karşılamak için y ay içinde depolama durumunda x tutarı satın almamız gerekecek." Tüm bunlar ihtiyaçlarımıza uygun şekilde çalışıyor.

Periyodik olarak, rakamlarımızda öngörmeyi başlatan tek seferlik büyük hareketlerimiz vardır. Örneğin, birisi artık ihtiyaç duyulmayan 500 GB'lık eski yedekler bulur ve siler. Alanı geri kazanmak için onlar için iyi! Bununla birlikte, tahminlerimiz bir aydaki bu büyük düşüşten dolayı çarpık durumda. Her zaman böyle bir düşüşün modellerden çıkmanın 9-10 ay sürdüğünü kabul ettik, ancak sermaye gideri planlama sezonuna giriyorsak çok uzun zaman alabilir.

Öngörülen değerler o kadar fazla etkilenmeyecek şekilde bir kerelik bu varyansları ele almanın bir yolu olup olmadığını merak ediyorum (örneğin, hattın eğimi önemli ölçüde değişmez), ancak bunlar dikkate alınır (örn. zaman içinde belirli bir nokta ile ilişkili y değerinde bir defalık değişiklik). Bunun üstesinden gelmeye yönelik ilk girişimlerimiz bazı çirkin sonuçlar verdi (örneğin üstel büyüme eğrileri). Önemli ise SQL Server'da tüm işlemlerimizi yapıyoruz.


Mükemmel soru. Sadece hızlı bir açıklama. Bu olayları tahmin etmek mi yoksa gerçekleştikten sonra yeni bilgilerinizle ilgili model tahminlerini ayarlamak ister misiniz?
Matthew Drury

1
Doğru, 500GB örneği gibi bu nadir olayları "düzeltmeye" çalışıyorsanız, sonuçlarınızı çok fazla etkilemedikleri veya saklamak için kaltak ayarlamaları yaparken yakalamak istediğinizden daha fazla hesaplamaya çalışıyorsanız açık değil. yapıldı? Fark incedir: Birincisinde, yeni noktayı (nadir olay) neredeyse yoksaymak istersiniz, ancak ikincisinde, noktayı vurgulamak istersiniz (nadir olay). Eğer eski ise, güçlü regresyon sizin için basit bir yöntemdir, çünkü zaten doğrusal regresyon kullanıyorsunuzdur. Buraya bakın: ats.ucla.edu/stat/r/dae/rreg.htm
StatsStudent

Ayrıca, tahminlerinizi yapmak için herhangi bir yazılım kullanıyor musunuz ve güven aralıkları kullanıyor musunuz?
İstatistiklerÖğrenci

Bundan sonra bir ayar ekleyebilirim. Aslında, çoğu zaman gelecek ayın rakamlarına bakıp büyük bir değişiklik görene kadar büyük bir sapma hakkında bilgim olmayacak. Tahmin yapmak için herhangi bir yazılım kullanmıyorum; regresyon değerlerimi hesaplamak için sadece SQL Server'da saklı bir prosedür.
16:12

Hızlı reaksiyonlar: (a) Muhtemelen ilk önce log disk kullanımındaki değişikliklere çok temel bir AR (1) sığdırır mıyım? Temel olarak disk kullanımında uzun vadeli bir büyüme oranı ve disk kullanımındaki büyüme oranının bir şoktan sonra bu eğilime ne kadar hızlı geri döndüğünü tahmin edersiniz. (aa) Diğer verileri de kullanabilir ve bir VAR (vektör otoregresyonu) takabilirsiniz. (b) 12 aydan büyük tüm verilerin dışarı atılması yapılması en uygun şey olmayabilir. (c) düzenli OLS, karelerin toplamını en aza indirir. Aykırı değerlere karşı daha sağlam olan farklı bir ceza fonksiyonu kullanabilirsiniz (örn. Huber).
Matthew Gunn

Yanıtlar:


0

İşte basit bir öneri. Sizin için işe yarayıp yaramadığını bilmiyorum ve belki de bir yorum olarak yapmalıydım, ancak bir yorum yapmak için cevap vermekten daha fazla ayrıcalığa ihtiyacınız var gibi görünüyor.

Doğru anlarsam, kullandığınız rakamlar her ay kullandığınız depolama miktarıdır. Muhtemelen bu normal olarak artar ve eğilimler devam ederse, gelecekte bir zamanda miktarın ne olacağını tahmin etmek istersiniz. Büyük değişikliğinizin gerçekleştiğini (ör. 500 GB'ın piyasaya sürüldüğünü) fark ettikten sonra, geri dönüp önceki ayların rakamlarını değiştirebilir misiniz (örneğin hepsinden 500 GB'yi silebilirsiniz)? Temel olarak, önceki ayların rakamlarını olması gereken şeye göre ayarlamaktır, eğer şimdi ne bildiğinizi biliyorsanız.

Eski rakamlara geri dönebildiğinizden emin olmadığınız sürece elbette bunu önermiyorum. Ancak yapmak istediğiniz tahmin, Excel'de bile yapılabilir, bu durumda istediğiniz kadar sürüme sahip olabilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.