İş yerinde beklentileri nasıl yönetiyorsunuz?

22

Veri Bilimi, Makine Öğrenimi ve çevresindeki tüm başarı öykülerindeki tüm kasırga ile Veri Bilimcilerinden ve onların öngörücü modellerinden hem gerekçelendirilmiş hem de fazla şişirilmiş beklentiler var.

İstatistikleri, Makine Öğrenimi uzmanlarını ve Veri Bilimcilerini uygulama sorumu şudur: özellikle modellerin tahmin doğruluğu konusunda şirketinizdeki iş adamlarından beklentileri nasıl yönetiyorsunuz? Önemsizce söylemek gerekirse, en iyi modeliniz sadece% 90 doğruluk sağlayabilirse ve üst yönetim% 99'dan az bir şey beklemiyorsa, bu gibi durumları nasıl ele alırsınız?

performance accuracy

— nöron
kaynak

1

Güzel soru! Ama sanırım bir topluluk wiki olmalı

— Alexey Grigorev

1

Güzel soru. Yapılan (ve yapıyor), Orada o: D

— Dawny33

11

Akılcı iş adamları doğruluk için ödeme yapmazlar.

karlı bir süreçte para kazanmak (böylece daha karlı hale getirmek) veya
yeni para yaratma (yeni karlı süreçler yaratma).

Bu nedenle, yürütülen herhangi bir projenin bunu yansıtacak şekilde ele alınması gerekmektedir. İlk adım, daima üzerinde çalıştığınız iki işlemden hangisini anlamaktır ve bunun nasıl gerçekleştiğine dair net bir fikre sahip olmalısınız;

Bir sürecin doğruluğunu artırabilirseniz, muhtemelen firma için para kazanabilirsiniz ve iş adamları ilerlemenize yatırım yapar. Bir iş insanının yüzde 99 doğrulukta ısrar etmesinin ve yüzde 90'ı reddetmesinin tek rasyonel nedeni, zaten bunu yüzde 90'dan daha iyi olan bir yöntem yapmalarıydı. Bu durumda elbette kendi pozisyonlarında haklılar.

Çalıştığınız projelerin iş vakasını, İş Adamlarının anlayacağı şekilde anlamak ve sunmak, herhangi bir Mühendisin olgunlaşma sürecinin bir parçasıdır. En azından günümüz ortamında, Data Science'ın benzersiz bazı yönleri olmasına rağmen (daha düşük olgunluk, ancak tesadüfi huzur keşif olasılığı gibi).

Bu adımı açıklayan Data Science'a yakın bir süreç burada bulunabilir: https://en.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining

Ancak çoğu Kurumsal Mimari Çerçevesi benzer şekilde uygulanabilir.

— Mike Wise
kaynak

1

Güzel bitti. Cevabınız tür beklentiden ayrılır. Bravo!

— untitledprogrammer

Garip bir şekilde, buradaki oy benim puanlarıma girmedi.

— Mike Wise

10

Rekabetçi meslektaşları toplayın. En gelişmiş teknolojiyi deneyin ve belirleyin ve modelinizin bununla nasıl karşılaştırıldığını görün. Ayrıca, ekibinizin üzerinde ne kadar süre çalıştığına da bağlıdır. Bilim odaklı modeller statik olarak yaratılmazlar, dinamik olarak gelişirler, çünkü iyi bir bilim adamı her zaman onu geliştirmenin yollarını bulmaya çalışır.

Üst yönetim personeli bir veri bilimcisinin , bazen / sıklıkla kalitelerini bilmeden yeni yöntemler araştırdığını bilmelidir . Makine öğrenimi tekniklerinin hemen mükemmel modeller üretmediğini bilmeleri gerekir. Olsalardı, yine de zor olmazdı.

Bir veri bilimcisi, sonuçlarını nasıl haklılaştırdığı, tartıştığı ve geleceği nasıl planladığı ile değerlendirilmelidir. Yönetim personelinin beklentilerini yerine getirebilmesinin bir yolu, gerçek dışı olarak yüksek olanlara sahip olmamaktır.

Yine de, bağlam alanında makul sonuçlar bekleniyorsa, şu soruları düşünün:

Sonuçlar zamanla düzeldi mi / alacak mı?
Gelecekteki beklentileri olumlu mu?
Sonuçlar benzer sistemlere kıyasla (rakiplerden) ne kadar iyi?

— lennyklb
kaynak

5

Bu soruyu seviyorum çünkü her organizasyonda var olan politikaya giriyor. Benim görüşüme göre ve önemli ölçüde, model performansına ilişkin beklentiler bir organizasyonun "teknik olarak okuryazar" olduğu kurum kültürünün ve derecenin bir işlevidir. Ne demek istediğimi açıklığa kavuşturmanın bir yolu, 4 büyük "veri bilimi" varlığı - Google, FB, Amazon ve Yahoo gibi - 4 büyük ajans tutma kuruluşu - WPP, Omnicon, Interbrand ve Publicis arasındaki farkları göz önünde bulundurmaktır. Google ve diğerleri çok teknik olarak okuryazar. Öte yandan, acentelerin teknoloji fobisine yaslandıkları bilinmektedir. Bunun kanıtı nedir? Öncelikle, teknik olarak okuryazar olan grup, mühendisler, bilgisayar bilimcileri, meraklılar ve güçlü teknik geçmişine sahip insanlar tarafından kuruldu veya yönetiliyor. Teknoloji okuma yazma bilmeyen şirketleri kim işletiyor? Yumuşak iletişim ve insan yetenekleri sayesinde öne çıkan pazarlamacılar. Ve sadece bu değil, NYC'deki bu dükkanların bazılarında çalıştım, bu kuruluşların yüksek teknik olarak okur-yazar olan türleri kültürle “uygun” olmadığı için sistematik olarak cezalandırdığını ve / veya zorladığını söyleyebilirim. Ardından, toplam (borsa) piyasa sınırlarını göz önünde bulundurun, Teknoloji okuryazar grubu yaklaşık 800 milyar dolara eklenirken, teknoloji okuma yazma bilmeyen grup 80 milyar tutarındadır. Teknoloji okuryazarlığı varlıkları, pazar başlığındaki diğerlerinden 10 kat daha büyüktür. Bu, piyasa beklentilerinin açık bir ifadesidir ve okuma yazma bilmeyenler için yüksek değildir. Öyleyse, fazladan tahminle, bunun gibi bozosun “öngörücü doğruluğu” beklentilerine meydan okumak için ne tür bir umut olabilir? NYC'deki bu dükkanların bazılarında çalıştıktan sonra, bu kuruluşların yüksek teknik olarak okuryazar olan türleri kültürle “uygun” olmadığı için sistematik olarak cezalandırdığını ve / veya zorladığını söyleyebilirim. Ardından, toplam (borsa) piyasa sınırlarını göz önünde bulundurun, Teknoloji okuryazar grubu yaklaşık 800 milyar dolara eklenirken, teknoloji okuma yazma bilmeyen grup 80 milyar tutarındadır. Teknoloji okuryazarlığı varlıkları, pazar başlığındaki diğerlerinden 10 kat daha büyüktür. Bu, piyasa beklentilerinin açık bir ifadesidir ve okuma yazma bilmeyenler için yüksek değildir. Öyleyse, fazladan tahminle, bunun gibi bozosun “öngörücü doğruluğu” beklentilerine meydan okumak için ne tür bir umut olabilir? NYC'deki bu dükkanların bazılarında çalıştıktan sonra, bu kuruluşların yüksek teknik olarak okuryazar olan türleri kültürle “uygun” olmadığı için sistematik olarak cezalandırdığını ve / veya zorladığını söyleyebilirim. Ardından, toplam (borsa) piyasa sınırlarını göz önünde bulundurun, Teknoloji okuryazar grubu yaklaşık 800 milyar dolara eklenirken, teknoloji okuma yazma bilmeyen grup 80 milyar tutarındadır. Teknoloji okuryazarlığı varlıkları, pazar başlığındaki diğerlerinden 10 kat daha büyüktür. Bu, piyasa beklentilerinin açık bir ifadesidir ve okuma yazma bilmeyenler için yüksek değildir. Öyleyse, fazladan tahminle, bunun gibi bozosun “öngörücü doğruluğu” beklentilerine meydan okumak için ne tür bir umut olabilir? Toplam (borsa) piyasa değerlerini göz önünde bulundurun, Teknoloji okuryazarlık grubu yaklaşık 800 milyar dolar eklerken teknoloji okuryazarlık grubu 80 milyar tutarındadır. Teknoloji okuryazarlığı varlıkları, pazar başlığındaki diğerlerinden 10 kat daha büyüktür. Bu, piyasa beklentilerinin açık bir ifadesidir ve okuma yazma bilmeyenler için yüksek değildir. Öyleyse, fazladan tahminle, bunun gibi bozosun “öngörücü doğruluğu” beklentilerine meydan okumak için ne tür bir umut olabilir? Toplam (borsa) piyasa değerlerini göz önünde bulundurun, Teknoloji okuryazarlık grubu yaklaşık 800 milyar dolar eklerken teknoloji okuryazarlık grubu 80 milyar tutarındadır. Teknoloji okuryazarlığı varlıkları, pazar başlığındaki diğerlerinden 10 kat daha büyüktür. Bu, piyasa beklentilerinin açık bir ifadesidir ve okuma yazma bilmeyenler için yüksek değildir. Öyleyse, fazladan tahminle, bunun gibi bozosun “öngörücü doğruluğu” beklentilerine meydan okumak için ne tür bir umut olabilir?

Bu nedenle, kültürel kopuşa ve düştiğiniz yere bağlı olarak, gerçekçi beklentilerinizin az ya da çok olması gerekir. Tabii ki, farklı "teknoloji okuma yazma bilmeyen" kuruluşlar ne yaptıklarını bilen yöneticilere sahip olacaklardır, ancak çoğu zaman bu varlıklara teknik becerilerdeki en düşük ortak payda aptallığı hakimdir, yani en iyi teknikte olan insanlar yarı okur yazarlar (ve tehlikeli) veya daha yaygın olarak, tamamen saygısız ancak bunu bilmiyorlar. Durumda, c-suite destelerden temizlenmiş "korelasyon" gibi kelimeler isteyen bir adam için çalıştım. Bu aşırı bir durum: sonuçta, her sekreter "korelasyon" un ne olduğunu bilir.

Bu, "Neden% 99 öngörülen doğruluk elde edemiyorsun?" İyi bir yanıt, "Neden böyle bir gerçek dışı yüksek PA'nın mümkün olduğunu varsayıyorsunuz?" Gibi bir soruyu cevaplamaktır. Bir diğeri, "Çünkü eğer gerçekten% 99 PA almış olsaydım, yanlış bir şey yaptığımı varsaydım." % 90 PA ile bile doğru olması muhtemel.

Model değer için tek kriter olarak PA'da ısrarın daha temel bir sorusu var. Son zamanlarda Leo Breiman, PA'nın bir olduğu istatistiksel ve kestirimci modelleme topluluğu üzerinde birçok ayak izi bıraktı. PA'ya olan asıl endişesi, 90'lı yıllarda, tek bir CART ağacının yönetilmesinde doğabilecek dengesizlik ve hata ile ilgili birçok eleştiriyi ele almaktı. Onun çözümü “rasgele ormanları”, ağaç yapısını ortadan kaldırarak doğruluğu en üst düzeye çıkaracak ve kararsızlığı azaltacak yaklaşık ve geçici bir yöntem olarak motive etmekti. Tek bir lojistik regresyon modelindeki hataya karşı, düşük MSE'yi ~ 1000 yinelemeli RF "mini-model" den kıyasladı. Tek sorun, göz kamaştırıcı elmaları portakal karşılaştırması yapmaktan hiç rahatsız etmemesiydi:

2008 Netflix Ödülü, öneri sistemlerinin MSE'sini geliştirebilecek herhangi bir istatistikçiye veya takıma büyük miktarda para ödülü verdi. O zamanlar Netflix bu sisteme yılda 150 milyon dolar harcıyordu, masrafların müşteri sadakatinde ve başka türlü seçilmeyen filmlerin alımında geri kazanıldığından daha fazla olduğuna ikna olmuştu. Sonunda kazananlar, 107 farklı modelden oluşan karmaşık bir topluluk kullandılar.

Ancak Netflix'in öğrendiği gibi, asıl sorun, tamamen yüklü bir maliyet perspektifinden, mevcut modellerine göre hatalardaki gerçek iyileşmenin 5 puanlık puanda sadece% 0,005'lik bir azalma olmasıydı. BT'nin zaman içinde maliyeti olduğunu söyleme, 107 model kazanan takımın ağır kaldırma ve bakımının, hata azaltmadaki kazancı iptal etmekten daha fazla olduğu anlamına gelmez. Bu göz önüne alındığında, Netflix sonunda MSE'nin peşinden ayrıldı ve artık Netflix Ödülü'ne layık görülmedi

Ve işte bu nokta şudur: prediktif hatayı en aza indirgemek, kolayca oynanabilir ya da saldırıya uğrayabilir ve analist sahtekarlığına eğilimli olabilir (yani, analistin modelleme becerilerini yücelten, potansiyel yıl sonu bonusunu olumlu yönde etkileyen bir çözüm bulma). Dahası, ekonomik ve ticari boşlukta belirlenen tamamen istatistiksel bir çözüm ve amaçtır. Metrik, yardımcı yan teminat maliyetlerinin çok az veya hiç dikkate alınmamasını sağlar - A'dan Z'ye değerlendirilen ve tam yüklü, takas bazlı karar verme sürecinin ayrılmaz bir parçası olması gereken çok gerçek operasyonel sonuçlar.

Bu organizasyonlara gömülü olan sorunlardan biri haline geldi ve değiştirilmesi çok, çok zor. Başka bir deyişle, PA kullanımıyla uyarılar hakkında bu öfkeyle yel değirmenlerinde eğildiğimin farkındayım.

— DJohnson
kaynak