In Atmosferik Bilimlerde İstatistiksel Yöntemler öngörüleri arasında çok güçlü intercorrelations (3. Baskı, sayfa 559-560) varsa, Daniel Wilks notları çoklu lineer regresyon problemlerine yol açabilir:
Çoklu doğrusal regresyonda ortaya çıkabilecek bir patoloji, güçlü karşılıklı korelasyonlara sahip bir dizi öngörücü değişkenin, kararsız bir regresyon ilişkisinin hesaplanmasına neden olabilmesidir.
(...)
Daha sonra temel bileşen regresyonunu tanıttı:
Bu sorunun çözümüne yönelik bir yaklaşım, ilk olarak yordayıcıları, aralarındaki bağıntıların sıfır olduğu temel bileşenlerine dönüştürmektir.
Çok uzak çok iyi. Ama sonra, açıklamadığı (ya da en azından anlamam için yeterli detayda olmadığı) bazı açıklamalar yapıyor:
Tüm ana bileşenler bir ana bileşen regresyonunda tutulursa, tam öngörücü kümesine uyan geleneksel en küçük kareler üzerinde hiçbir şey kazanılmaz.
(..) ve:
Asıl bileşen regresyonunu orijinal öngörücüler açısından yeniden ifade etmek mümkündür, ancak sonuç genel olarak sadece bir veya birkaç ana bileşen öngörücüsü kullanılmış olsa bile tüm orijinal öngörücü değişkenleri içerecektir. Bu yeniden yapılandırılmış regresyon, genellikle varyans çok daha küçük olmasına rağmen, genel olarak daha küçük bir MSE ile sonuçlanacak şekilde önyargılı olacaktır.
Bu iki noktayı anlamıyorum.
Tabii ki, tüm temel bileşenler korunursa, öngörücüleri orijinal alanlarında kullandığımızla aynı bilgileri kullanırız. Bununla birlikte, karşılıklı korelasyon problemi ana bileşen alanında çalışılarak giderilir. Hâlâ fazla takılabiliriz, ama tek sorun bu mu? Neden hiçbir şey kazanılmıyor?
İkincisi, ana bileşenleri kessek bile (belki gürültü azaltma ve / veya aşırı takmayı önlemek için), bu neden ve nasıl yeniden yapılandırılmış bir yeniden gerilemeye yol açar? Ne şekilde önyargılı?
Kitap kaynağı: Daniel S. Wilks, Atmosfer Bilimlerinde İstatistiksel Yöntemler, Üçüncü Baskı, 2011. Uluslararası Jeofizik Serisi Cilt 100, Akademik Yayın.