Bir arkadaşım yazılım endüstrisinin kendi başına istatistik becerilerine değil, öncelikle "büyük veri" becerilerine ihtiyaç duyduğunu öne sürdü.
Arkadaşınızın yorumunu kısmen kabul ederken, herhangi bir endüstride Büyük veri araçlarının yalnızca tüm V'ler memnun olduğunda seçildiğini belirtmek isterim.
Lider bir müşteri destek şirketinde veri bilimi başkanı olarak çalışıyorum. Burada hem ürün için hem de şirketin büyümesi için veri korsanlığı yapıyorum.
Ben öncelikle karmaşa tahmini ve satış analizi için zaman serisi analiz tekniklerini kullanıyorum. Bu aynı zamanda müşterilerin, rekabetin ve endüstrinin davranış analizini de içerir.
Ürün tarafında, LSTM'leri, öneri algoritmalarını vb. Kullanarak duyarlılık analizinden başlayarak bir dizi teknik kullanıyoruz.
Ancak ana odak noktası zaman serisi analizidir. Genel iş akışı:
- Verilerin temizlenmesi ve kalıplanması.
- mevsimsellik, eğilimler ve döngülerin tanımlanmasını içeren keşif ve açıklayıcı analizler. Yani, korelasyonları, oto-korelasyonları ve birkaç tek değişkenli ve iki değişkenli istatistikleri araştırmak gerekir; saçılma, AFC, PAFC eğrileri de dahil olmak üzere kapsamlı çizim ile birlikte.
- Şimdi, çeşitli modellerin birbirleriyle test edildiği, 2. adımı ciddi olarak dikkate alan tahmin kısmı geliyor.
Benim kullandığım araçlar: R, Python ve Excel bazen.
Ve hatta veri bilimi ve büyüme korsanlığı karışımının bile pazarlama alanında sihir yaptığı kanıtlanmıştır. Yani, istatistikçi ve matematik ineklerine olan talep olduğu gibi kalacaktı; ve yakın gelecekte hiçbir yerde düşmeyecek; özellikle müşteri odaklı girişimler dünya çapında açıldığında.