Ben bir R
dil programcısıyım. Ayrıca Veri Bilim İnsanları olarak kabul edilen ancak CS dışındaki akademik disiplinlerden gelen insanlar grubuyum.
Bu, bir Veri Bilimcisi olarak benim rolümde iyi sonuç veriyor, ancak kariyerime başlayarak R
ve sadece diğer betik / web dilleri hakkında temel bilgileri öğrenerek, 2 kilit alanda kendimi yetersiz hissediyorum:
- Programlama teorisi sağlam bir bilgi eksikliği.
- Rekabetçi gibi hızlı ve daha yaygın olarak kullanılan dilde beceri düzeyinin eksikliği
C
,C++
veJava
boru hattı ve Büyük Veri hesaplamaların hızını artırmak için hem de daha kolay perhizden haline gelebilmektedir DS / veri ürünler oluşturmak için yararlanılabilir, arka uç komut dosyaları veya bağımsız uygulamalar.
Çözüm elbette basit - gidip programlama hakkında bilgi edinin, bazı derslere kayıt yaparak ne yapıyorum (şu anda C programlama).
Ancak şimdi yukarıdaki 1. ve 2. numaralı problemleri çözmeye başladığım için kendime " Dilbilim C
ve Dilbilim için diller ne kadar uygulanabilir C++
? "
Örneğin, verileri çok hızlı bir şekilde taşıyabilir ve kullanıcılarla gayet iyi etkileşimde bulunabilirim, peki ya gelişmiş regresyon, Makine Öğrenmesi, metin madenciliği ve diğer daha gelişmiş istatistiksel işlemler?
Yani. C
işi yapabilir - gelişmiş istatistikler, ML, AI ve diğer Veri Bilimi alanları için hangi araçlar var? Ya ben programlayarak kazanılan verimlilik en gevşek olmalıdır C
üzerinde arayarak R
komut dosyaları veya diğer diller?
Şimdiye dek C'de bulduğum en iyi kaynak , Destek Vektör Makineleri, doğrusal regresyon (doğrusal olmayan ve multinom probit, vb. Gibi diğer gelişmiş regresyonlar vb.) Ve diğerlerinin kısa bir listesini veren / veren yeteneği olan Shark adlı bir kütüphanedir . (büyük ama) istatistiksel fonksiyonlar.C
C++