R programlama dilini kullanarak veri bilimi üzerine bir giriş dersi vermeye hazırlanıyorum. Dinleyicilerim iş konularında uzmanlaşan lisans öğrencileri. Tipik bir işletme lisans programı herhangi bir bilgisayar programlama deneyimine sahip değildir, ancak Excel kullanan birkaç ders almıştır.
Kişisel olarak, R (veya diğer programlama dilleri) ile çok rahatım çünkü bilgisayar bilimi üzerine yoğunlaştım. Ancak, öğrencilerimin çoğunun programlama dilini öğrenmeye karşı temkinli hissedeceklerine inanıyorum çünkü onlar için zor görünebilir.
Excel'e biraz aşinam var ve inanıyorum ki Excel basit veri bilimi için yararlı olsa da, öğrencilerin veri bilimi için ciddi bir programlama dili (örneğin, R veya Python) öğrenmeleri gerekiyor. Kendimi ve öğrencileri Excel'in veri bilimi okuyan ciddi bir işletme öğrencisi için yetersiz olduğuna ve bazı programlama öğrenmeleri gerektiğine nasıl ikna edebilirim?
Yoruma yanıt olarak düzenlendi
Burada ele alacağım konulardan bazıları:
- Veri işleme ve veri temizleme
- Bir veri tablosunu değiştirme, örneğin, bir satır alt kümesi seçme (filtre), yeni değişkenler ekleme (mutasyona uğrama), satırları sütunlara göre sıralama
- Dplyr paketini kullanarak SQL birleşimleri
- Ggplot2 paketini kullanarak çizimleri (saçılma çizimleri, çubuk çizimleri, histogramlar vb.) Çizme
- Doğrusal regresyon, lojistik regresyon, sınıflandırma ağaçları ve k-en yakın komşuları gibi istatistiksel modelleri tahmin etme ve yorumlama
Excel'i çok iyi bilmediğim için, tüm bu görevlerin Excel'de kolayca yapılıp yapılamayacağını bilmiyorum.