Veri bilimcisi görüşme sorusu: Doğrusal regresyon düşük ve ne yapardınız


10

Röportaj yapanın bana fiyat esnekliği modeli için çok düşük olduğunu (% 5 ila 10 arasında) varsayalım diye bir iş için bir görüşme sorusuyla karşılaştım . Bu soruyu nasıl çözersiniz?R2

Neyin yanlış gittiğini veya doğrusal olmayan herhangi bir yöntemin uygulanması gerekip gerekmediğini görmek için regresyon teşhisi yapacağım dışında başka bir şey düşünemedim. Her nasılsa görüşmeci cevaptan memnun olmadığını düşünüyorum. Böyle bir senaryoda, düşük olmasına rağmen bir modele uymak ve üretim seviyesi tahmini için kullanmak için başka bir şey var mı ?R2

Düzenleme : Daha sonraki bir aşamada bana görüşme sırasında sorunu modellemek için veri verdi ve ben herhangi bir fark olup olmadığını görmek için gecikmeli değişkenler, rakip fiyat etkisi, mevsimsel mankenleri eklemeye çalıştı. yüzde 17.6'ya geriledi ve bekletme örneğindeki performansı zayıftı. Şahsen ben yanlış sonuçlar verecek ve müşteri kaybı sonuç verecek gibi canlı ortamda tahmin için böyle bir model koymak için etik olmadığını düşünüyorum (şirket gelirinde böyle bir modelden fiyatlandırma tavsiye kullanarak hayal!). Bu tür senaryolarda, herkesin bilmesi gereken çok açık olan başka bir şey var mı? Farkında olmadığım bir şey, hangisine 'gümüş kurşun' demeye cazip geldim?R2

Ayrıca, ekzojen değişken ekledikten sonra % 2 daha da geliştiğini düşünelim, o zaman bu senaryoda ne yapılabilir? Modelleme projesini atmalı mıyız, yoksa yine de dağıtım örneğindeki performansla gösterilen bir üretim seviyesi kalite modeli geliştirme umudu var mı?R2

Edit2 : Bu soruyu ekonomi perspektifinden anlamak için bu soruyu economics.stackexchange.com forumuna gönderdim


12
"senin varsayalım bir fiyat esnekliği modeli için (% 5 ila 10 arasında) çok düşük" bir soru değil . " 2'nizin bir fiyat esneklik modeli için çok düşük (% 5 ila 10 arasında)" yanıtım "tamam, tamamlandı" olurdu. Bir sorun olmadığını varsayalım, bu yüzden yapacak başka bir şey yok. Gerçekten gelecek olmasalardı, bunun hangi yönünü çözme problemi olarak gördüklerini sormalıyım. Onların yokluğunda, burada sorun olarak ne görüyorsunuz ? R2R2
Glen_b -M Monica'yı

1
Kendi kendine çalışma için etiketledim @ Glen_b daha fazla ayrıntı eklemem gerekiyorsa bana bildirin. Teşekkürler!
Meraklı

2
Teşekkürler, bu iyi bir şey. Ancak daha fazla ayrıntı, çözmeniz gereken gerçek soruyu içerir. "X varsayalım" bir şey çözmenizi istemeyen bir durum sunuyor.
Glen_b -M Monica'yı

1
En Çapraz yayınlanmıştır economics.stackexchange.com/q/16617 . Lütfen bir soru için en iyi siteye karar vermeye çalışın: varyantları farklı sitelere göre düzenlemeye değer olduğunu düşünüyorsanız, bunları yine de bağlayın.
Scortchi - Monica'yı eski durumuna döndürün

1
@Scortchi, her iki forumda da bağlantıyı ek düzenleme olarak ekledim. Teşekkürler!
Meraklı

Yanıtlar:


11

Ya soruna bu perspektiften bakarsak. Fiyat esnekliği, talep ile bir ürünün fiyatı arasındaki ilişkidir.

Bu durumda r-kare düşük olduğunda, o zaman söz konusu ürün için fiyat ve talep arasındaki ilişkinin güçlü olmadığı anlamına gelebilir.

Fiyatlandırma açısından bakıldığında, talep üzerinde büyük bir etkisi olmadan keyfi olarak fiyatlandırabileceğiniz bir ürün bulduğunuz anlamına gelebilir VEYA talebin farklı fiyatlandırmaya rağmen oldukça düzensiz olduğu anlamına gelebilir.

Veblen mallarına bakarsanız, esnekliğin ters olduğu örneklerdir. Fiyat arttıkça talep de artar.

Öte yandan, r-kare düşükse, talep olduğunda fiyatın nispeten önemsiz olduğu bir ürün kategorisi anlamına gelebilir. Başımın tepesinden bir kanser ilacı, bu özelliğe yapışabilecek bir şey olabilir. İlacın önemi fiyattan daha ağır basarsa emreder ve talepte değişiklik gösteremez.

Ve sonuç olarak, görüşmecinin niyetinin, daha yüksek bir r karesi ile daha iyi bir modelin nasıl oluşturulacağını bulmak yerine düşük bir r karesinin ne anlama geldiğini bilip bilmediğinizi yargılamak olabileceğini varsayıyorum.


Sonuç için +1. Ayrıca bu sorunun amacının, adayın körü körüne tam olarak anlamadan bir metriği takip edip etmediğini görmeye çalıştığını düşünüyorum.
Haitao Du

5

Görüşmecinin neyin peşinde olduğundan emin değilim ama kötü şekillendirici bir modelle karşılaştığımda bunlar benim düşündüğüm şeyler ve görüşmeci olarak duymayı çok sevdiğim bir cevap (birkaç yıldır görüşmekteyiz).

  1. Daha fazla veri alma : Bu her zaman yardımcı olmayabilir, ancak bu çözüm etkilerini değerlendirmenize yardımcı olabilecek birkaç şey vardır:

    • Modeli farklı örnek boyutlarıyla çalıştırın - sonuçlar daha fazla veriyle iyileşirse, daha fazla veri almanın makul olması model performansını iyileştirmeye devam edecektir.
    • Özellikler - örnek oranı - özellikleri seçtikten sonra her özellik değeri için yeterli örneğe sahip olup olmadığınızı anlamaya çalışın. Bu konuda cevaplanmış bir soruya bakın .
    • Eksik hedef değerler - esneklik, farklı fiyat aralıkları arasında benzer şekilde davranmayabilir. Örnek verilerinin belirli bir aralığa doğru eğilimli olduğu bir durumda, genelleme yapamayacağınız iyi bir şans vardır (örneğin, örneklerin% 90'ı 0-10 arası ve diğer% 10'u arasındaki fiyatlar içindir 1000-10000). Bu sorunla başa çıkmanın daha fazla veri almaktan başka yolları vardır (model eğitimini ayırın, regresyon kullanmayın).
  2. Daha iyi özellik mühendisliği : Yeterli veriye sahipseniz ve derin öğrenmeyi biliyorsanız, belki de bu önemsizdir. Belirtilen kriterlere uymamanız durumunda, çabalarınızı buna odaklayın. Kullanıcı davranışı modellerinde, insan sezgilerimizin makine tarafından eğitilmiş bir modelden daha iyi anlaşılması ile ilgili birçok ilişki vardır.
    Birkaç daha fazla özellik ve gelişmiş model performansı bu kadar büyük ölçüde tasarladığınız durumda olduğu gibi. Bu adım, genellikle mantık tabanlı kod içerdiğinden hatalara eğilimlidir (eğer Elses / Mathematical formüller).

  3. Daha iyi model seçimi : Önerdiğiniz gibi, belki doğrusal olmayan bir model daha iyi çalışır. Verileriniz homojen mi? Çapraz özelliklerin fiyat esnekliğini daha iyi açıklayacağına inanmak için nedenleriniz var mı? (mevsimsellik * rakibin fiyatı).

  4. Hiper parametreler ayarlama : ızgara arama modelinin hiper parametreleri (+ çapraz doğrulama sonuçları) iyi bir uygulamadır, ancak deneyimime göre performansı nadiren (kesinlikle% 5'ten% 90'a kadar değil) geliştirir.

Yapılacak daha çok şey var, ancak bu noktalar yeterince genel.


1

@DaFanat ve @Arun tarafından önerilenlerin üstüne, bazı görsel incelemelerin yardımcı olabileceğini eklemek isterim.

R2


Bu gerçekten bir gelir yönetimi sorunu olduğu için etki alanına özgü girdiyi paylaştığınız için teşekkür ederiz
Enthusiast
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.