Veri Bilimi

2

Destek Vektör Makineleri hala nişlerinde “en son teknoloji” sayılıyor mu?

Bu soru, başka bir soruda gördüğüm yoruma cevap olarak geliyor. Yorum, Coursera'daki Makine Öğrenimi kursu müfredatıyla ve “SVM'ler bugünlerde çok fazla kullanılmamaktadır”. İlgili dersleri yeni bitirdim ve SVM'leri anlamam, sınıflandırma için sağlam ve verimli bir öğrenme algoritması olduklarını ve bir çekirdek kullanırken, belki de 10 ila 1000 arasında bir dizi …

58 data-mining svm state-of-the-art

11

Boyutsallık azaltma nedir? Özellik seçimi ve çıkarma arasındaki fark nedir?

Wikipedia'dan boyutsallık azaltma veya boyutsal küçültme, incelenen rastgele değişken sayısını azaltma işlemidir ve özellik seçimi ve özellik çıkarımına ayrılabilir. Özellik seçimi ve özellik çıkarma arasındaki fark nedir? Doğal Dil İşleme görevinde bir boyutluluk azaltma örneği nedir?

58 feature-selection feature-extraction dimensionality-reduction

5

Bir model ne zaman hazırlanır?

Mantık, genellikle bir modeli benimseyerek, genelleştirme kapasitesinin arttığını belirtir. Bununla birlikte, bir modelin altında yatan bir noktada açıkça, verilerin karmaşıklığına bakılmaksızın modellerin daha da kötüleşmesine neden olduğu belirtildi. Modelinizin doğru dengeye oturduğunu ve modellemek istediği verileri desteklemediğini nereden biliyorsunuz? Not: Bu, " Neden Aşırı Kıyafet Veriliyor? "

56 efficiency algorithms parameter

4

1x1 konvolüsyonlar tamamen bağlı bir katmanla aynıdır?

Geçenlerde Yan LeCuns'in 1x1 konvolüsyonları hakkındaki yorumunu okudum : Konvolüsyonlu Ağlarda, "tamamen bağlantılı katmanlar" diye bir şey yoktur. Yalnızca 1x1 evrişim çekirdekleri ve tam bir bağlantı tablosu olan evrişim katmanları vardır. Çok nadiren anlaşılan bir gerçek, ConvNets'in sabit boyutlu bir girişe sahip olması gerekmiyor. Bunları, tek bir çıkış vektörü üreten …

55 neural-network convnet

3

RNN vs CNN yüksek seviyede

Tekrarlayan Sinir Ağları (RNN) ve çeşitleri ve Konvolüsyonel Sinir Ağları (CNN) ve çeşitleri hakkında düşünüyordum. Bu iki noktanın söylemesi adil olur mu: Bir bileşeni (görüntü gibi) alt bileşenlere (görüntüdeki nesnenin, örneğin görüntüdeki nesnenin anahatları gibi) parçalamak için CNN'leri kullanın. Alt bileşenlerin birleşimini oluşturmak için RNN'leri kullanın (resim yazısı, metin oluşturma, …

53 machine-learning neural-network beginner

8

İnternet şirketleri neden veri bilimci işi için Java / Python'u tercih ediyor?

Python / Java deneyimini isteyen veri bilimcileri için iş tanımında defalarca görüyorum ve R'yi göz ardı ediyorum. Aşağıda linkedin aracılığıyla başvurduğum bir şirketin baş veri bilimcisinden aldığım kişisel bir e-posta adresi. X, İlgilendiğiniz ve bağlantı kurduğunuz için teşekkür ederiz. İyi Analytics Becerileriniz var. Bununla birlikte, tüm veri bilimcilerimiz Java / …

53 beginner tools career reference-request

2

Ne zaman kullanılmalı (He veya Glorot) düzgün init üzerinden normal başlatma? Ve Toplu Normalleştirme ile etkileri nelerdir?

Artık Ağın (ResNet) O'nun normal kullanıma hazırlanmasını popüler yaptığını biliyordum. ResNet'te He normal başlatma, ilk katman He üniforma başlatmayı kullanır. ResNet makalesine ve "Doğrultucuların Derinliklerine Çıkarma" kağıdına baktım. Ayrıca: Toplu Normalleştirme, çok daha yüksek öğrenme oranları kullanmamızı ve başlatma konusunda daha az dikkatli olmamızı sağlar. Toplu Normalleştirme makalesinin özetinde, Toplu …

51 neural-network deep-learning normalization

8

Kümelenme coğrafi konum koordinatları (enlem, uzun çiftler)

Coğrafi konum kümelenmesi için doğru yaklaşım ve kümeleme algoritması nedir? Coğrafi konum koordinatlarını kümelemek için aşağıdaki kodu kullanıyorum: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y = kmeans2(whiten(coordinates), 3, iter = 20) plt.scatter(coordinates[:,0], …

51 machine-learning python clustering k-means geospatial

9

Python kullanarak tekrarlanabilir veri bilimi için araçlar ve protokol

Python kullanarak bir veri bilimi projesi üzerinde çalışıyorum. Projenin birkaç aşaması var. Her aşama, Python scriptleri, yardımcı veriler, konfigürasyon ve parametreler kullanılarak bir veri seti almak ve başka bir veri seti oluşturmaktan oluşur. Kodu git içinde sakladım, böylece o kısım kapsanacak. Şunu duymak isterim: Veri sürüm kontrolü için araçlar. Aşamaları …

50 python tools version-control

3

Derin bir sinir ağında donatı ile mücadele nasıl

Yapay sinir ağları (NN) ile başladığımda, asıl sorun olarak fazla donmakla savaşmam gerektiğini düşündüm. Ancak uygulamada NN'imin% 20 hata oranı engelini aşmasını bile sağlayamıyorum. Rasgele ormandaki puanımı bile geçemiyorum! NN'in verilerdeki trendleri yakalamaya başlaması için ne yapılması gerektiği konusunda çok genel veya çok genel bir tavsiye arıyorum. NN uygulanması için …

50 neural-network deep-learning

4

Gizli Dirichlet Tahsisi - Hiyerarşik Dirichlet Süreci

Gizli Dirichlet Tahsisi (LDA) ve Hiyerarşik Dirichlet Süreci (HDP) hem konu modelleme süreçleridir. En büyük fark LDA'nın konu sayısının belirtilmesini gerektirmesi ve HDP'nin gerektirmemesi. Neden böyle? Ve her iki konu modelleme yönteminin farklılıkları, artıları ve eksileri nelerdir?

49 nlp topic-model lda

8

Makine Öğreniminde Neden Aşırı Güçlendirme Neden?

Mantık genellikle, bir modelin üzerine oturtularak, genelleştirme kapasitesinin sınırlı olduğunu belirtir, ancak bu sadece modelleme işleminin bir modelin belirli bir karmaşıklıktan sonra gelişmesini engellediği anlamına gelebilir. Fazla donanım, modellerin verilerin karmaşıklığına bakılmaksızın daha da kötüleşmesine neden oluyor mu ve öyleyse neden bu böyle? İlgili: Yukarıdaki soruyu takip etmek, " Bir …

49 machine-learning predictive-modeling

9

Bayesian Networks'ün sinir ağlarından daha iyi performans gösterdiği bir alan var mı?

Yapay sinir ağları Computer Vision görevlerinde en iyi sonuçları alır (bkz. MNIST , ILSVRC , Kaggle Galaxy Challenge ). Computer Vision'daki diğer tüm yaklaşımlardan daha iyi performans gösteriyorlar. Ancak başka görevler de var: Kaggle Moleküler Aktivite Mücadelesi Regresyon: Kaggle Yağmuru tahmini , 2. sıra Kavrayın ve Kaldırma 2. de üçüncü …

48 machine-learning pgm

4

Yapay sinir ağları: hangi maliyet fonksiyonu kullanılacak?

TensorFlow'u özellikle sinir ağları ile yapılan deneyler için kullanıyorum . Her ne kadar bazı deneyler yapmama rağmen (XOR-Problem, MNIST, bazı Regresyon işleri, ...) şimdi, belirli problemler için "doğru" maliyet fonksiyonunu seçmekle uğraşıyorum, çünkü genel olarak bir başlangıç olarak kabul edilebilirim. TensorFlow'a gelmeden önce, tamamen bağlı bazı MLP'leri ve bazı tekrarlayan …

48 machine-learning python neural-network statistics tensorflow

9

R dili Büyük Veriler için uygun mu

R, Veri Analizini amaçlayan birçok kütüphaneye sahiptir (örneğin JAGS, BUGS, ARULES vb.) Ve aşağıdaki gibi popüler ders kitaplarında bahsedilmiştir: J.Krusche, Bayesian Veri Analizi yapmak; B.Lantz, "R ile Makine Öğrenmesi". Bir veri kümesinin Büyük Veri olarak kabul edilmesi için 5 TB'lık bir kılavuz gördüm. Sorum şu: R tipik olarak Büyük Veri …

48 bigdata r