Tam açıklama: Ben bir istatistikçi değilim, ne de bir iddiada bulunuyorum. Ben düşük bir BT yöneticisiyim. Lütfen benimle nazik oynayın. :)
Kuruluşumuz için disk depolama kullanımını toplamak ve tahmin etmekten sorumluyum. Depolama kullanımımızı aylık olarak toplarız ve tahminler için basit bir yuvarlanan on iki aylık doğrusal regresyon kullanırız (başka bir deyişle, bir projeksiyon yaparken yalnızca önceki on iki aylık veriler dikkate alınır). Bu bilgileri tahsis ve sermaye gideri planlaması için kullanıyoruz, örneğin "Bu modele dayanarak, ihtiyaçlarımızı karşılamak için y ay içinde depolama durumunda x tutarı satın almamız gerekecek." Tüm bunlar ihtiyaçlarımıza uygun şekilde çalışıyor.
Periyodik olarak, rakamlarımızda öngörmeyi başlatan tek seferlik büyük hareketlerimiz vardır. Örneğin, birisi artık ihtiyaç duyulmayan 500 GB'lık eski yedekler bulur ve siler. Alanı geri kazanmak için onlar için iyi! Bununla birlikte, tahminlerimiz bir aydaki bu büyük düşüşten dolayı çarpık durumda. Her zaman böyle bir düşüşün modellerden çıkmanın 9-10 ay sürdüğünü kabul ettik, ancak sermaye gideri planlama sezonuna giriyorsak çok uzun zaman alabilir.
Öngörülen değerler o kadar fazla etkilenmeyecek şekilde bir kerelik bu varyansları ele almanın bir yolu olup olmadığını merak ediyorum (örneğin, hattın eğimi önemli ölçüde değişmez), ancak bunlar dikkate alınır (örn. zaman içinde belirli bir nokta ile ilişkili y değerinde bir defalık değişiklik). Bunun üstesinden gelmeye yönelik ilk girişimlerimiz bazı çirkin sonuçlar verdi (örneğin üstel büyüme eğrileri). Önemli ise SQL Server'da tüm işlemlerimizi yapıyoruz.