Profesörümün gerçek bir regresyon modeli oluşturmamızı, bir veri örneği taklit etmemizi istediği bir ev ödevi üzerinde çalışıyorum ve sınıfta öğrendiğimiz bazı teknikleri kullanarak gerçek regresyon modelimizi bulmaya çalışacak. Aynı şekilde, bize verdiği bir veri kümesiyle de aynısını yapmak zorundayız.
O, onu kandırmaya çalışan tüm geçmiş denemeler için oldukça doğru bir model üretebildiğini söylüyor. Bazı çılgın modeller yaratan bazı öğrenciler vardı ama tartışmalı olarak sadece daha basit olan daha basit bir model üretebildi.
Bulması için zor bir model nasıl geliştirebilirim? 4 kuadratik terim, 3 gözlem ve büyük sapma yaparak süper ucuz olmak istemiyorum? Altında sert küçük bir modeli olan, görünüşte zararsız bir veri kümesini nasıl üretebilirim?
Sadece uyması gereken 3 Kural var:
Veri kümenizde bir "Y" değişkeni ve "Y", "X1", ..., "X20" olarak etiketlenmiş 20 "X" değişkeni bulunmalıdır.
Yanıt değişkeniniz , aşağıdakileri sağlayan doğrusal bir regresyon modelinden : burada ve .Y ′ i = β 0 + β 1 X ′ i 1 + … + β p - 1 X ′ i , p - 1 + ϵ i ϵ i ∼ N ( 0 , σ 2 ) p ≤ 21
oluşturmak için kullanılan tüm değişkenleri veri kümenizde bulunur.Y
Unutulmamalıdır ki, 20 X değişkeninin hepsinin gerçek modelinizde olması gerekmez
Fama-Fransız 3 Faktör Modeli gibi bir şey kullanmayı ve hisse senedi verileriyle (SPX ve AAPL) başlamasını ve biraz daha gizlemek için bu değişkenleri sürekli bileşik getirilere dönüştürmesi gerektiğini düşünüyordum. Ama bu beni ilk gözlemde ve zaman serisinde (henüz sınıfta tartışmamış olduğumuz) eksik değerlerle terk ediyor.
Böyle bir şey göndermek için uygun bir yer olup olmadığından emin değilim. İyi bir tartışma yaratabileceğini hissettim.
Düzenleme: Ben de özellikle "önceden oluşturulmuş" modeller için sormuyorum. İstatistikte birisinin bunu yapmasını sağlayacak konular / araçlar hakkında daha fazla merak ediyorum.