Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

2
Destek Vektör Makineleri hala nişlerinde “en son teknoloji” sayılıyor mu?
Bu soru, başka bir soruda gördüğüm yoruma cevap olarak geliyor. Yorum, Coursera'daki Makine Öğrenimi kursu müfredatıyla ve “SVM'ler bugünlerde çok fazla kullanılmamaktadır”. İlgili dersleri yeni bitirdim ve SVM'leri anlamam, sınıflandırma için sağlam ve verimli bir öğrenme algoritması olduklarını ve bir çekirdek kullanırken, belki de 10 ila 1000 arasında bir dizi …


5
Bir model ne zaman hazırlanır?
Mantık, genellikle bir modeli benimseyerek, genelleştirme kapasitesinin arttığını belirtir. Bununla birlikte, bir modelin altında yatan bir noktada açıkça, verilerin karmaşıklığına bakılmaksızın modellerin daha da kötüleşmesine neden olduğu belirtildi. Modelinizin doğru dengeye oturduğunu ve modellemek istediği verileri desteklemediğini nereden biliyorsunuz? Not: Bu, " Neden Aşırı Kıyafet Veriliyor? "

4
1x1 konvolüsyonlar tamamen bağlı bir katmanla aynıdır?
Geçenlerde Yan LeCuns'in 1x1 konvolüsyonları hakkındaki yorumunu okudum : Konvolüsyonlu Ağlarda, "tamamen bağlantılı katmanlar" diye bir şey yoktur. Yalnızca 1x1 evrişim çekirdekleri ve tam bir bağlantı tablosu olan evrişim katmanları vardır. Çok nadiren anlaşılan bir gerçek, ConvNets'in sabit boyutlu bir girişe sahip olması gerekmiyor. Bunları, tek bir çıkış vektörü üreten …

3
RNN vs CNN yüksek seviyede
Tekrarlayan Sinir Ağları (RNN) ve çeşitleri ve Konvolüsyonel Sinir Ağları (CNN) ve çeşitleri hakkında düşünüyordum. Bu iki noktanın söylemesi adil olur mu: Bir bileşeni (görüntü gibi) alt bileşenlere (görüntüdeki nesnenin, örneğin görüntüdeki nesnenin anahatları gibi) parçalamak için CNN'leri kullanın. Alt bileşenlerin birleşimini oluşturmak için RNN'leri kullanın (resim yazısı, metin oluşturma, …

8
İnternet şirketleri neden veri bilimci işi için Java / Python'u tercih ediyor?
Python / Java deneyimini isteyen veri bilimcileri için iş tanımında defalarca görüyorum ve R'yi göz ardı ediyorum. Aşağıda linkedin aracılığıyla başvurduğum bir şirketin baş veri bilimcisinden aldığım kişisel bir e-posta adresi. X, İlgilendiğiniz ve bağlantı kurduğunuz için teşekkür ederiz. İyi Analytics Becerileriniz var. Bununla birlikte, tüm veri bilimcilerimiz Java / …

2
Ne zaman kullanılmalı (He veya Glorot) düzgün init üzerinden normal başlatma? Ve Toplu Normalleştirme ile etkileri nelerdir?
Artık Ağın (ResNet) O'nun normal kullanıma hazırlanmasını popüler yaptığını biliyordum. ResNet'te He normal başlatma, ilk katman He üniforma başlatmayı kullanır. ResNet makalesine ve "Doğrultucuların Derinliklerine Çıkarma" kağıdına baktım. Ayrıca: Toplu Normalleştirme, çok daha yüksek öğrenme oranları kullanmamızı ve başlatma konusunda daha az dikkatli olmamızı sağlar. Toplu Normalleştirme makalesinin özetinde, Toplu …

8
Kümelenme coğrafi konum koordinatları (enlem, uzun çiftler)
Coğrafi konum kümelenmesi için doğru yaklaşım ve kümeleme algoritması nedir? Coğrafi konum koordinatlarını kümelemek için aşağıdaki kodu kullanıyorum: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y = kmeans2(whiten(coordinates), 3, iter = 20) plt.scatter(coordinates[:,0], …

9
Python kullanarak tekrarlanabilir veri bilimi için araçlar ve protokol
Python kullanarak bir veri bilimi projesi üzerinde çalışıyorum. Projenin birkaç aşaması var. Her aşama, Python scriptleri, yardımcı veriler, konfigürasyon ve parametreler kullanılarak bir veri seti almak ve başka bir veri seti oluşturmaktan oluşur. Kodu git içinde sakladım, böylece o kısım kapsanacak. Şunu duymak isterim: Veri sürüm kontrolü için araçlar. Aşamaları …

3
Derin bir sinir ağında donatı ile mücadele nasıl
Yapay sinir ağları (NN) ile başladığımda, asıl sorun olarak fazla donmakla savaşmam gerektiğini düşündüm. Ancak uygulamada NN'imin% 20 hata oranı engelini aşmasını bile sağlayamıyorum. Rasgele ormandaki puanımı bile geçemiyorum! NN'in verilerdeki trendleri yakalamaya başlaması için ne yapılması gerektiği konusunda çok genel veya çok genel bir tavsiye arıyorum. NN uygulanması için …

4
Gizli Dirichlet Tahsisi - Hiyerarşik Dirichlet Süreci
Gizli Dirichlet Tahsisi (LDA) ve Hiyerarşik Dirichlet Süreci (HDP) hem konu modelleme süreçleridir. En büyük fark LDA'nın konu sayısının belirtilmesini gerektirmesi ve HDP'nin gerektirmemesi. Neden böyle? Ve her iki konu modelleme yönteminin farklılıkları, artıları ve eksileri nelerdir?
49 nlp  topic-model  lda 

8
Makine Öğreniminde Neden Aşırı Güçlendirme Neden?
Mantık genellikle, bir modelin üzerine oturtularak, genelleştirme kapasitesinin sınırlı olduğunu belirtir, ancak bu sadece modelleme işleminin bir modelin belirli bir karmaşıklıktan sonra gelişmesini engellediği anlamına gelebilir. Fazla donanım, modellerin verilerin karmaşıklığına bakılmaksızın daha da kötüleşmesine neden oluyor mu ve öyleyse neden bu böyle? İlgili: Yukarıdaki soruyu takip etmek, " Bir …


4
Yapay sinir ağları: hangi maliyet fonksiyonu kullanılacak?
TensorFlow'u özellikle sinir ağları ile yapılan deneyler için kullanıyorum . Her ne kadar bazı deneyler yapmama rağmen (XOR-Problem, MNIST, bazı Regresyon işleri, ...) şimdi, belirli problemler için "doğru" maliyet fonksiyonunu seçmekle uğraşıyorum, çünkü genel olarak bir başlangıç ​​olarak kabul edilebilirim. TensorFlow'a gelmeden önce, tamamen bağlı bazı MLP'leri ve bazı tekrarlayan …

9
R dili Büyük Veriler için uygun mu
R, Veri Analizini amaçlayan birçok kütüphaneye sahiptir (örneğin JAGS, BUGS, ARULES vb.) Ve aşağıdaki gibi popüler ders kitaplarında bahsedilmiştir: J.Krusche, Bayesian Veri Analizi yapmak; B.Lantz, "R ile Makine Öğrenmesi". Bir veri kümesinin Büyük Veri olarak kabul edilmesi için 5 TB'lık bir kılavuz gördüm. Sorum şu: R tipik olarak Büyük Veri …
48 bigdata  r 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.