Öncelikle, bir programcı ve veritabanı geliştiricisi açısından veri bilimine yolculuğuma başladığımı açıklığa kavuşturmama izin verin. Ben 10 yıllık bir veri bilimi uzmanı veya istatistiksel bir tanrı değilim. Bununla birlikte, dünya çapında oldukça büyük müşterileri ile çalışan bir şirket için veri uzmanı ve büyük veri setleri veriyorum.
Tecrübelerime göre, veri bilimcisi işi yapmak için ihtiyaç duydukları araçları kullanıyor. Excel, R, SAS, Python ve daha fazlası, iyi veri bilimci için bir araç kutusundaki araçlardır. En iyisi, verileri analiz etmek ve sıkıştırmak için çok çeşitli araçlar kullanabilir.
Bu nedenle, R'yi Python ile karşılaştırırken bulursanız, o zaman muhtemelen veri bilimi dünyasında her şeyi yanlış yapıyorsunuzdur. İyi veri bilimcileri, ikisini birden diğerine kullanmanın mantıklı olduğu durumlarda kullanırlar. Bu aynı zamanda Excel için de geçerlidir.
Her şeyde harika iken birçok farklı araç ve dilde deneyime sahip birini bulmak oldukça zor. Ayrıca sadece karmaşık algoritmaları programlamakla kalmayıp aynı zamanda istatistiksel bir bakış açısıyla nasıl kullanılacağını da bilen veri bilimci bulmanın zor olacağını düşünüyorum.
Çalıştığım veri bilimcisinin çoğu yaklaşık 2 lezzetle geliyor. Programlayabilenler ve yapamayanlar. Python'da veri çekebilen, Pandas gibi bir şeyle işleyebilen, R'deki verilere modelleyen ve ardından hafta sonunda yönetime sunan veri bilimcisi ile nadiren çalışıyorum.
Yani, onların var olduğunu biliyorum. Web kazıyıcıları geliştiren, Hadoop'a iten, Python'da geri çeken, karmaşık şeyleri programlayan ve önyüklemek için R üzerinden çalıştıran birçok veri bilimi blogunu okudum. Onlar var. Dışarıdalar. Sadece hepsini yapabilen çok fazla şey yaşamadım. Belki de sadece benim alanım?
Yani, bu sadece kötü bir konuda uzmanlaşmak anlamına mı geliyor? Hayır. Çok sayıda arkadaşım sadece bir ana dilde uzmanlaşıp onu öldürüyor. Sadece R'yi tanıyan ve öldüren birçok veri adamı tanıyorum. Ayrıca veriyi analiz etmek için Excel'i kullanan çok sayıda insan tanıyorum, çünkü çoğu veri dışı bilim insanının açabileceği ve kullanabileceği tek şey (özellikle B2B şirketlerinde). Gerçekten cevaplamanız gereken soru, eğer bu pozisyon için ihtiyacınız olan TEK şey mi? Ve en önemlisi, yeni şeyler öğrenebilirler mi?
PS
Veri Bilimi sadece "BÜYÜK VERİLER" veya NoSQL ile sınırlı değildir.