İstatistik + Bilgisayar Bilimi = Veri Bilimi? [kapalı]


10

veri bilimcisi olmak istiyorum . Uygulamalı istatistik (aktüeryal bilim) okudum , bu yüzden büyük bir istatistiksel arka planım var (regresyon, stokastik süreç, zaman serisi, sadece birkaç söz için). Ama şimdi, Akıllı Sistemlerde Bilgisayar Bilimi odaklı yüksek lisans yapacağım .

İşte çalışma planım:

  • Makine öğrenme
  • Gelişmiş makine öğrenimi
  • Veri madenciliği
  • Bulanık mantık
  • Öneri Sistemleri
  • Dağıtık Veri Sistemleri
  • Bulut bilişim
  • Bilgi keşfi
  • İş zekası
  • Bilgi alma
  • Metin madenciliği

Sonunda, tüm istatistik ve bilgisayar bilimleri bilgimle, kendime veri bilimcisi diyebilir miyim? , yoksa yanılıyor muyum?

Cevaplar için teşekkürler.



Bu soru konu dışı gibi görünüyor çünkü kariyer tavsiyesi ile ilgili. Kariyer tavsiyelerinin kanaat odaklı, geniş sorularla veya bazen aşırı kısıtlı sorularla sonuçlandığı kanıtlanmıştır; bunların çoğu yararlı bir söylemle sonuçlanmaz. Bu görüşe katılmıyorsanız, lütfen Data Science Meta hakkındaki sorunu dile getirin .
asheeshr

Özetle, hayır. Veri + Bilimsel Yöntem = Veri Bilimi :-). Diğer her şey oraya ulaşmak için sadece bir metodolojidir
I_Play_With_Data

Yanıtlar:


1

Uzman bir veri bilimcisi olmak için doğru yolda olduğunuzu düşünüyorum . Son zamanlarda burada Veri Bilimi StackExchange ile ilgili soruyu cevapladım: https://datascience.stackexchange.com/a/742/2452 ( esas olarak sorunuzu kendi başına cevapladığı için, burada bahsettiğim tanıma dikkat edin . yazılım mühendisliğini uygulama ve gerçek dünya problemlerini çözmede bilgi uygulama yönleri ). Umarım hepsini faydalı bulursunuz. Kariyerinde iyi şanslar!


9

Bu ne tür bir "Veri Bilimi" ne girmek istediğinize bağlıdır. Temel analitik ve raporlama istatistikleri için kesinlikle yardımcı olacaktır, ancak Makine Öğrenimi ve Yapay Zeka için birkaç beceri daha isteyeceksiniz

  • Olasılık teorisi - saf olasılıkta sağlam bir arka plana sahip olmalısınız, böylece daha önce görülüp görülmediği herhangi bir problemi olasılık ilkelerine ayırabilirsiniz. İstatistikler, halihazırda çözülmüş problemler için çok yardımcı olur, ancak yeni ve çözülmemiş problemler, olasılığın derinlemesine anlaşılmasını gerektirir, böylece uygun teknikleri tasarlayabilirsiniz.

  • Bilgi Teorisi - bu (istatistiklere göre) oldukça yeni bir alandır (hala on yıllar eski olsa da), en önemli eser Shannon'dı, ancak literatürde daha da önemli ve sıklıkla ihmal edilen not Hobson'un Kullback-Leibler Diverjansının olduğunu kanıtlayan çalışmasıdır. "bilgi ölçüsü" kavramını gerçekten yakalayan tek matematiksel tanımdır . Artık yapay zeka için temel olan bilgiyi ölçmek mümkün. "İstatistik Mekaniği Kavramları" - Arthur Hobson (çok pahalı kitap, sadece akademik kütüphanelerde mevcuttur).

  • Karmaşıklık Teorisi- Birçok Veri Bilimcisinin katı bir karmaşıklık teorisi arka planına sahip olmadığı büyük bir sorun, algoritmalarının ölçeklenmemesi veya büyük veriler üzerinde çalışması için çok uzun zaman almasıdır. Örneğin PCA'yı ele alalım, birçok insan röportaj sorusuna "veri setimizdeki özelliklerin sayısını nasıl azaltırsınız" sorusuna favori cevap verir, ancak adaylara "veri kümesi gerçekten çok büyüktür" derken bile, O (n ^ 3) olan PCA. Göze çarpmak istiyorsanız, her bir sorunu kendi başına çözebilmek istersiniz, Büyük Veri'nin çok kalçadan önce uzun bir süre önce tasarlanan bazı ders kitabı çözümünü ATMAYIN. Bunun için, sadece teorik olarak değil, pratik olarak da işlerin ne kadar sürdüğünü anlamalısınız - bu yüzden bir algoritmayı dağıtmak için bir bilgisayar kümesini nasıl kullanacağınızı,

  • İletişim Becerileri - Veri Biliminin büyük bir kısmı işi anlamaktır. İster veri bilimi tarafından yönlendirilen bir ürün icat ediyor ister veri bilimi tarafından yönlendirilen iş anlayışı sağlıyor olsun, hem Proje hem de Ürün Yöneticileri, teknoloji ekipleri ve diğer veri bilimcilerinizle iyi iletişim kurabilmeniz çok önemlidir. Harika bir fikre sahip olabilirsiniz, harika bir AI çözümü söyleyin, ancak (a) Niye iş parası kazanacak etkili bir şekilde iletişim kuramıyorsanız, (b) kolejlerinizi çalışacağına ikna edin ve (c) teknoloji insanlarına nasıl ihtiyacınız olduğunu açıklayın inşa etmek için yardım, o zaman bitmeyecek.


6

Veri bilimcisi (benim için) büyük bir şemsiye terim. Veri madenciliği, veri madenciliği, makine öğrenimi, örüntü sınıflandırma ve istatistik alanlarındaki teknikleri yetkin bir şekilde kullanabilen bir kişi olarak görürdüm.

Bununla birlikte, bu terimler iç içe geçmiştir: makine öğrenimi örüntü sınıflandırma ile bağlanır ve ayrıca veri madenciliği verilerde örüntüler bulma konusunda örtüşür. Ve tüm tekniklerin altında yatan istatistiksel ilkeler vardır. Bunu her zaman büyük bir kesişme noktasına sahip bir Venn diyagramı olarak hayal ediyorum.

Bilgisayar bilimleri de bu alanlarla ilgilidir. Bilgisayar-bilimsel araştırma yapmak için "veri bilimi" tekniklerine ihtiyacınız olduğunu söyleyebilirim, ancak bilgisayar bilimi bilgisinin mutlaka "veri bilimi" ile ilgili olması gerekmez. Bununla birlikte, programlama becerileri - programlama ve bilgisayar bilimini, problemleri çözmek için programlamanın daha fazla araç olduğu farklı meslekler olarak görüyorum - verilerle çalışmak ve veri analizi yapmak da önemlidir.

Gerçekten güzel bir çalışma planınız var ve hepsi mantıklı. Ama kendinize sadece "veri bilimcisi" demek istiyorsanız "emin değilim", "veri bilimcisi" nin her şey ya da hiçbir şey anlamına gelebilecek belirsiz bir terim olduğu izlenimine kapıldım. Aktarmak istediğim şey, bir veri bilimcisinden "daha" - daha "uzman" bir şey olacağınızdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.