Beysbolu takip eden herkes muhtemelen Toronto'nun Jose Bautista'nın MVP tipi performansını hiç duymamıştı. Önceki dört yıl içinde, sezon başına yaklaşık 15 ev atışını vurdu. Geçtiğimiz yıl, beyzbol tarihinde sadece 12 oyuncu tarafından geride bırakılan 54 sayısını vurdu.
2010 yılında kendisine 2,4 milyon ödeme yapıldı ve takıma 2011 için 10,5 milyon istiyor. 7,6 milyon teklif ediyorlar. Bunu 2011'de tekrarlayabilirse, her iki miktara da kolayca değecektir. Fakat tekrarlama ihtimali nedir? Ortadan gerilemesini ne kadar zorlayabiliriz? Performansının ne kadarının şanstan kaynaklandığını bekleyebiliriz? Ortalamaya göre düzeltilmiş 2010 toplamlarının regresyonunun ne olmasını bekleyebiliriz? Nasıl anlarım?
Lahman Beyzbol Veritabanı ile oynuyorum ve önceki beş sezonda sezon başına en az 50 vuruş yapan tüm oyuncular için ev sahibi toplamlarını döndüren bir sorgu çıkardım.
Tablo şöyle görünüyor (10. sıradaki Jose Bautista'ya dikkat edin)
first last hr_2006 hr_2007 hr_2008 hr_2009 hr_2010
1 Bobby Abreu 15 16 20 15 20
2 Garret Anderson 17 16 15 13 2
3 Bronson Arroyo 2 1 1 0 1
4 Garrett Atkins 29 25 21 9 1
5 Brad Ausmus 2 3 3 1 0
6 Jeff Baker 5 4 12 4 4
7 Rod Barajas 11 4 11 19 17
8 Josh Bard 9 5 1 6 3
9 Jason Bartlett 2 5 1 14 4
10 Jose Bautista 16 15 15 13 54
ve tam sonucu (232 satır) burada bulabilirsiniz .
Nereden başlayacağımı gerçekten bilmiyorum. Birisi beni doğru yönde gösterebilir mi? Bazı ilgili teori ve R komutları özellikle yardımcı olacaktır.
Lütfen teşekkürler
mehmetçik
Not: Örnek biraz anlaşılmıştır. Evdeki koşular kesinlikle bir oyuncunun değerinin en iyi göstergesi değildir ve evdeki toplamlar, bir meyvenin evdeki koşuları vurma şansına sahip olduğu sezon başına değişen şans sayısını dikkate almaz (plaka görünümleri). Bazı oyuncuların daha uygun stadyumlarda oynadığını ve ligdeki ortalama evdeki koşuların yıldan yıla değiştiğini yansıtmıyor. Ortalamaya regresyon muhasebesinin ardındaki teoriyi kavrayabilirsem, bunu HR'lerden daha uygun önlemlerde kullanabilirim.