Hokey oyuncuları tarafından atılan toplam kariyer hedeflerini tahmin ederken Poisson regresyonunda bir ofset kullanıp kullanmayacağı


10

Bir ofset kullanıp kullanmama konusunda bir sorum var. Hokeydeki (toplam) gol sayısını tanımlamak istediğiniz çok kolay bir model olduğunu varsayalım. Yani hedefleriniz, oynanan oyunların sayısı ve oyuncu bir forvet ise 1'e eşit olan bir kukla değişken "forvet" var, aksi takdirde 0. Peki, aşağıdaki modellerden hangileri doğru bir şekilde belirtildi?

  1. goals = oyunlar + forvet veya

  2. hedefleri = offset (oyunlar) + forveti

Yine, hedefler genel hedeflerdir ve oyun sayısı tek bir oyuncu için genel oyunlardır. Örneğin, 100 oyunda 50 gol atan bir oyuncu ve 50 oyunda 20 gol atan başka bir oyuncu olabilir.

Hedef sayısını tahmin etmek istediğimde ne yapmam gerekir? Burada ofset kullanmak gerçekten gerekli mi?

Referanslar:


Bağımlı değişkeniniz nedir? Bir kariyerdeki belirli bir oyuncu için bugüne kadar toplam gol sayısı var mı? Ayrıca, oyun başına ortalama hedefleri tahmin etmek istememenizin bir nedeni var mı?
Jeromy Anglim

Evet toplam gol sayısı! Hayır, her oyun için veri yok. Sadece genel verilerim var.
MarkDollar

Bağımlı değişken (sayı) hedeftir. (Yukarıdaki denklemlere bakın)
MarkDollar

Bir önceki sorunun tekrarı olmaması için başlığı biraz değiştirdim. Yanlış yorumladığım takdirde değişiklik yapmaktan çekinmeyin.
Jeromy Anglim

Yanıtlar:


16

Bir ofset modeli, oyunun başına görebileceğiniz gibi oyun başına hedefleri modellemektedir:

log(goals/games) = a+bx

eşittir

log(goals) -log(games) = a+bx

eşittir

log(goals)= a+bx +log(games)   <-this is an offset model, assumes coef on the last term =1

35. sayfaya bakınız: http://www.ed.uiuc.edu/courses/EdPsy490AT/lectures/4glm3-ha-online.pdf

A + bx değerinin hedeflerin oyunlara günlük oranıyla (oran) ilişkili olduğunu düşünüyorsanız, bir uzaklık kullanın. Belki de deneyim biriktirmekten daha karmaşık bir oyun etkisi olduğunu düşünüyorsanız, bunu yapmayın. Daha fazla tartışma için, bkz. Http://ezinearticles.com/?The-Exposure-and-Offset-Variables-in-Poisson-Regression-Models&id=2155811


1

Ofsetler hakkındaki sorunuza doğrudan değinmeyen birkaç basit nokta:

  • Oyun sayısının atılan ortalama gollerle ilişkili olup olmadığına bir göz atacağım. Aklıma gelen birçok elit gol atma sporunda (örneğin, futbol, ​​Avustralya futbolu, vb.) Bir kariyerin uzun ömürlülüğünün bir kariyerin başarısı ile ilgili olduğunu tahmin edebilirim. Ve en azından gol atma rollerindeki oyuncular için başarı, atılan gol sayısı ile ilgilidir. Bu doğruysa, oyun sayısı iki etki yakalar. Sadece daha fazla oyunun gol atmak için daha fazla fırsat anlamına gelmesi; diğeri de beceriyle ilgili etkileri yakalayacaktı. Bunu keşfetmek için oyun sayısı ile atılan ortalama goller (örneğin, goller / oyun sayısı) arasındaki ilişkiyi inceleyebilirsiniz. Bunun yaptığınız herhangi bir modelleme için önemli sonuçları olduğunu düşünüyorum.
  • İçgüdülerim bağımlı değişkeni oyun başına ortalama hedeflere dönüştürmek. Daha fazla oyun oynayanlar için bir oyuncunun becerisinin daha kesin bir ölçümüne sahip olacağınızın farkındayım, belki de bu bir sorun olabilir. Modelinizde arzu ettiğiniz hassasiyete ve bunun sonucunda oyuncu araçlarının dağılımına bağlı olarak, standart doğrusal modelleme tekniklerine güvenebilirsiniz. Ama belki de bu sizin amaçlarınız için biraz fazla uygulanmış ve belki de atılan toplam hedefleri modellemek için nedenleriniz var.

Merhaba Jeromy! Neyi çözdüğünüz kesinlikle doğrudur. Ancak hedefleri / oyunları ölçen bir model oluşturmanın bir yolu yoktur. Bu yüzden yukarıdaki modele zorlandım (bağımlı olarak hedefler ve bağımsız değişken olarak oyunlar). Oyunların beceri gibi şeylerle ilişkili olduğunu ve bu sorunu araştırmam gerektiğini biliyorum (değişkenler problemi ve Endojenite atlandı). Ama şu anda yukarıdaki iki modelden hangisinin kullanılması gerektiğini merak ediyorum!
MarkDollar
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.