Makine öğrenmesi, istatistikçiler hakkında bilgi sahibi olmak için önemli bir konudur mu? Makine öğreniminin istatistik olduğu anlaşılıyor. İstatistik programları (lisans ve yüksek lisans) neden makine öğrenmesi gerektirmiyor?
Makine öğrenmesi, istatistikçiler hakkında bilgi sahibi olmak için önemli bir konudur mu? Makine öğreniminin istatistik olduğu anlaşılıyor. İstatistik programları (lisans ve yüksek lisans) neden makine öğrenmesi gerektirmiyor?
Yanıtlar:
Makine Öğrenmesi, yüksek boyutlu uygulamalı istatistiklerin uzmanlaşmış bir alanıdır. Ayrıca, özellikle lisans düzeyinde değil, aynı zamanda bir dereceye kadar lisans düzeyinde de iyi bir nicel program için gerekli olmayan önemli bir programlama altyapısı gerektirir. Sadece istatistiğin tahmin yönüne uygulamalıdır, oysa matematiksel istatistiklerin yanı sıra çıkarımsal ve betimleyici uygulamalı istatistikler dikkat gerektirir. Pek çok program, öğrencilere makine öğrenmesine (örneğin CMU) çok fazla maruz kalma şansı sunuyor, ancak genel olarak endüstriyel istatistikçiler, bazı yüksek profilli teknik işleri yasaklayarak bu araçları uygulama şansını nadiren alıyor.
Geçenlerde iş piyasasında pozisyonları öğrenme birçok veri bilimcisi ve makineyi gördük, ben arka plan öğrenme bir makine gerektirmez "istatistikçi" genel iş tanımını düşünüyorum, ama yok temel istatistikler, çıkarım ve iletişimin kusursuz bir anlayış gerektirir: Bunlar gerçekten bir lisansüstü istatistik programının çekirdeği olmalıdır. Makine öğrenimi ve veri bilimi ayrıca iş unvanları ve disiplinler olarak nispeten yenidir. İstatistiği istihdam edenlerin, problem çözme stratejilerini, 10 ila 20 yıl içerisinde etkinliğini sürdürmek için çoğunlukla işletme / eczacılık / biyoloji girişimlerinde bırakıldığı takdirde, makine öğrenmeye yönelik olarak sallamalarını istemek, bir kötüye kullanım olacaktır.
Son olarak, makine öğreniminin muazzam bir istatistik anlayışı sağladığını hissetmiyorum. İstatistikler temel olarak disiplinler arası bir alandır ve sizin seçtiğiniz teknik metodolojiyi tam olarak neden seçtiğinizi alanınızdaki teknik olmayan uzmanlarla iletişim kurmak ve ikna etmek önemlidir. Makine öğrenimi, uygulamalı uygulamaların çoğunda, standart araç ve tekniklerden yalnızca aşamalı olarak daha iyi performans vaat eden, yüksek düzeyde teknik bir alandır. Denetimli ve denetimsiz öğrenmedeki yöntemlerin çoğu uzman olmayanlar (ve hatta daha az eğitimli uzmanlar) tarafından "kara kutu" olarak algılanmaktadır. Belirli bir öğrenme yöntemi seçimlerini savunmaları istendiğinde, düz düşen ve uygulanan sorunlu motive edici koşulların hiçbirine dayanmayan açıklamalar vardır.
Pekala, lisans programlarımızda birlikte çalıştığımız bir veya iki kişiden öğrendiklerimizin gözünü kapattığımız görüşümüzle istatistiklerin filinden bahsedelim ...
Statik programlar uygun gördüklerini, yani öğrencilerin programda geçirecekleri sınırlı bir süre boyunca öğrenmelerini istedikleri en önemli şeyin ne olduğunu gerektirir. Bir dar alana ihtiyaç duyulması, eşit derecede önemli olduğu iddia edilebilecek diğer bazı alanlara elveda öpülmesi anlamına gelir. Bazı programlar ölçü teorik olasılık gerektirir, bazıları gerektirmez. Bazıları yabancı dil gerektiriyor, ancak çoğu program gerektirmiyor. Bazı programlar Bayesian paradigmasını çalışmaya değer tek şey olarak kabul eder, ancak çoğu yapmaz. Bazı programlar istatistikçiler için en fazla talebin anket istatistiklerinde olduğunu (en azından ABD'de olduğu gibi) bilmektedir, ancak çoğu yoktur. Biostat programları parayı takip eder ve SAS + 'a tıp ve eczacılık bilimlerine kolayca satacak yöntemleri öğretir.
Tarımsal deneyler tasarlayan veya telefon anketleri yoluyla anket verilerini toplayan veya psikometrik ölçekleri doğrulayan veya bir CBS'de hastalık insidans haritaları üreten bir kişi için makine öğrenmesi, günlük olarak üzerinde çalıştığı istatistiklerden çok uzak bir bilgisayar bilimi soyut sanatıdır. temeli. Bu insanların hiçbiri öğrenme destek vektör makineleri veya rastgele ormanlardan herhangi bir acil fayda görmeyeceklerdir.
Sonuçta, makine öğrenmesi, diğer istatistik alanlarına güzel bir tamamlayıcıdır, ancak çok değişkenli normal dağılım ve genelleştirilmiş doğrusal modeller gibi ana akım şeylerin önce gelmesi gerektiğini savunuyorum.
Makine öğrenmesi verilerden bilgi edinme / öğrenme ile ilgilidir. Örneğin, DNA Microarray verilerinden (örneğin kanserler veya diyabet) belirli bir hastalık tipinde rol alabilecek birkaç gen seçebilen makine öğrenme algoritmaları ile çalışıyorum. Bilim adamları daha sonra bu genleri (öğrenilmiş modeller) gelecekte erken teşhis için (görünmeyen numunelerin sınıflandırılması) kullanabilirler.
Makine öğrenimi ile ilgili çok fazla istatistik vardır ancak istatistik gerektirmeyen makine öğrenim dalları vardır (örneğin genetik programlama). Bu durumlarda istatistiklere ihtiyacınız olacak tek zaman, makine öğrenimini kullanarak kurduğunuz bir modelin diğer bazı modellerden istatistiksel olarak anlamlı derecede farklı olup olmadığını görmek olacaktır.
Benim düşünceme göre, istatistikçiler için makine öğrenmeye giriş avantajlı olacaktır . Bu, istatistikçilere istatistik uygulamalarının gerçek dünya senaryolarını görmelerine yardımcı olacaktır. Ancak, zorunlu olmamalıdır . Başarılı bir istatistikçi olabilir ve tüm hayatınızı makine öğrenmeye yaklaşmak zorunda kalmadan geçirebilirsiniz!