Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

1
Genel olarak Yapay Sinir Ağlarında Aktivasyon Fonksiyonlarının Farkı
Sinir ağları için aktivasyon fonksiyon tiplerini inceledim. İşlevlerin kendileri oldukça basittir, ancak uygulama farkı tamamen açık değildir. İstenen ikili / sürekli çıkışa bağlı olarak mantıksal ve doğrusal tip fonksiyonları birbirinden ayırmak makul ancak sigmoid fonksiyonun basit doğrusal fonksiyona göre avantajı nedir? ReLU'nun benim için özellikle anlaşılması zordur, örneğin: pozitif girdiler …

3
Sözcük tabanlı ve karakter tabanlı metin oluşturma RNN'leri arasındaki fark nedir?
Tekrarlayan Sinir Ağları ile metin oluşturma hakkında okurken, nedenini belirtmeden , kelime kelime ve diğerleri karakter karakter üretmek için bazı örnekler uygulandığını fark ettim . Peki, kelime başına metni temel alan RNN modelleri ile karakter başına metni temel alan modeller arasındaki fark nedir? Kelime tabanlı RNN daha büyük bir boyut …

4
R: GPU'da makine öğrenimi
Eğitim hızını arttırmak için GPU'dan yararlanabilen R için makine öğrenme paketleri var mı (python dünyasından theano gibi bir şey)? GPU'da kod yürütülmesine izin veren gputools adlı bir paket olduğunu görüyorum, ancak makine öğrenimi için daha eksiksiz bir kütüphane arıyorum.

3
Sınırlı Boltzmann Makinesinin Arkasındaki Sezgi (RBM)
Geoff Hinton'un Coursera'daki Sinir Ağları kursuna katıldım ve aynı zamanda sınırlı boltzmann makinelerine giriş yaptım, yine de RBM'lerin arkasındaki sezgiyi anlamadım. Neden bu makinedeki enerjiyi hesaplamamız gerekiyor? Ve bu makinedeki olasılığın kullanımı nedir? Bu videoyu da gördüm . Videoda, hesaplama adımlarından önce olasılık ve enerji denklemlerini yazdı ve hiçbir yerde …


4
Scala Kullanan Veri Bilimi Araçları
Spark'ın Scala ile tamamen entegre olduğunu biliyorum. Kullanım durumu özellikle büyük veri kümeleri içindir. Başka hangi araçların iyi Scala desteği var? Scala daha büyük veri setleri için en uygun mudur? Yoksa daha küçük veri kümeleri için de uygun mu?

4
Önemli özellikler nasıl belirtilir?
Birçok veri kaynağından oluşan bir dizi gevşek yapılandırılmış veri (örneğin, Web tabloları / Bağlantılı Açık Veri) varsayalım. Bunu izleyen ortak bir şema yoktur ve her kaynak, değerleri tanımlamak için eş anlamlı öznitelikler kullanabilir (örn. "Milliyet" ve "bornIn"). Amacım, bir şekilde tanımladıkları varlıkları "tanımlayan" bazı "önemli" özellikler bulmaktır. Dolayısıyla, böyle bir …



3
Çarpık verileri neden normal bir dağılıma dönüştürüyoruz?
Kaggle'daki Konut fiyatları yarışmasının bir çözümünü yapıyordum ( Human Analog'un Konut Fiyatlarında Çekirdek: İleri Regresyon Teknikleri ) ve bu bölüme rastladım: # Transform the skewed numeric features by taking log(feature + 1). # This will make the features more normal. from scipy.stats import skew skewed = train_df_munged[numeric_features].apply(lambda x: skew(x.dropna().astype(float))) skewed …

4
Generatif Düşman Ağları ile büyük veri kümesi oluşturabilir miyiz
Eğitim için derin sinir ağımı besleyecek yeterli veri kümesini (görüntüler) bulamadığım bir sorunla uğraşıyorum. Scott Reed ve ark. Tarafından yayınlanan Generator Adversarial Text to Image Synthesis adlı makaleden çok etkilendim . Jeneratör Düşman Ağları. Mevcut küçük veri kümesini bir GAN modeline girdi olarak kullanabilir ve daha derin ağ modelleri ile …

4
İki kelime arasındaki benzerlik
İki kelime veya cümle arasındaki benzerliği belirlememe yardımcı olan bir Python kütüphanesi arıyorum. Bir İngilizce sözlük veya sözlük olmayan sözcük (ler) (Bu bir Kişi veya Şirket adı olabilir) ile sonuçlanacak Ses-Metin dönüştürme yapacağım Bundan sonra, bilinen bir kelime veya kelime ile karşılaştırmak gerekir. Misal: 1) Metin ses sonucuna: America Expansion'ı …
15 nlp  nltk 

2
Aktivasyon fonksiyonlarının neden monotonik olması gerekir?
Şu anda sinir ağları üzerinde bir sınava hazırlanıyorum. Önceki sınavların çeşitli protokollerinde nöronların aktivasyon fonksiyonlarının (çok katmanlı algılayıcılarda) monotonik olması gerektiğini okudum. Aktivasyon fonksiyonlarının ayırt edilebilir olması, çoğu noktada 0 olmayan bir türeve sahip olması ve doğrusal olmaması gerektiğini anlıyorum. Monotonik olmanın neden önemli / yararlı olduğunu anlamıyorum. Aşağıdaki aktivasyon …


2
Mahout'ta madde ve kullanıcı bazlı öneri farkı
Ben kullanıcı tabanlı ve öğe tabanlı öneri birbirinden tam olarak nasıl farklı bilmek istiyorum. Bunu tanımlar Kullanıcı tabanlı : Benzer kullanıcıları bularak öğeleri önerin. Bu, kullanıcıların dinamik yapısı nedeniyle ölçeklendirmek genellikle daha zordur. Öğe tabanlı : Öğeler arasındaki benzerliği hesaplayın ve önerilerde bulunun. Öğeler genellikle çok fazla değişmez, bu nedenle …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.