Master Bilgisayar Bilimi mi? İstatistik?
'Veri bilimi' tezinizin merkezinde mi olacak? Yoksa bir yan konu mu?
İstatistiklerde olduğunu ve tezinizi bir 'veri bilimi' sorununa odaklamak istediğinizi varsayacağım. Eğer öyleyse, o zaman tahıl karşı gideceğim ve bir veri kümesi veya bir ML yöntemi ile başlamam gerektiğini öneririz . Bunun yerine, iyi anlaşılmamış veya ML yöntemlerinin henüz başarılı olduğu kanıtlanmamış veya birçok rakip ML yönteminin olduğu, ancak hiçbirinin diğerlerinden daha iyi görünmediği ilginç bir araştırma problemi aramalısınız.
Şu veri kaynağını göz önünde bulundurun: Stanford Büyük Ağ Veri Kümesi Koleksiyonu . Eğer ederken olabilir , bu veriler kümelerinden birini seçmek bir sorun deyimi oluşturan ve ardından ML yöntemlerden bazıları listesini çalıştırın bu yaklaşım gerçekten çok ne olduğunu bildirilir gelmez veri bilim Bence değil de ilgilidir hepsi ve çok iyi bir yüksek lisans tezine yol açar.
Bunun yerine, bunu yapabilirsiniz: belirli bir kategoride ML kullanan tüm araştırma makalelerini arayın - örneğin, İşbirliği ağları (ortak yazarlık). Her kağıt okurken, onlar ne olduğunu öğrenmek için denemek vardı her ML yöntemiyle ve ne adrese mümkün değildi ile gerçekleştirmek mümkün. Özellikle "gelecekteki araştırma" önerilerini arayın.
Belki hepsi aynı yöntemi kullanır, ancak rakip ML yöntemlerini hiç denememiştir. Ya da belki de sonuçlarını yeterince doğrulamıyorlar ya da belki de veri setleri küçük, ya da araştırma soruları ve hipotezleri basit ya da sınırlıydı.
En önemlisi: bu araştırma hattının nereye gittiğini bulmaya çalışın. Bunu yapmak için neden uğraşıyorlar? Bu konuda önemli olan nedir? Nerede ve neden zorluklarla karşılaşıyorlar?