Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

4
Sinir ağlarında sigmoid fonksiyonun rol türevi
Sinir ağlarında sigmoid fonksiyonun türevinin rolünü anlamaya çalışıyorum. İlk önce sigmoid fonksiyonunu ve python kullanarak tanımdan tüm noktaların türevini çiziyorum. Bu türevin rolü tam olarak nedir? import numpy as np import matplotlib.pyplot as plt def sigmoid(x): return 1 / (1 + np.exp(-x)) def derivative(x, step): return (sigmoid(x+step) - sigmoid(x)) / …

2
Neden hem doğrulama kümesini hem de test kümesini kullanmalıyım?
Bir sinir ağını düşünün: Belirli bir veri kümesi için, bunu eğitim, doğrulama ve test kümesine böleriz. Klasik 60:20:20 oranında yaptığımızı varsayalım, o zaman ağı doğrulama kümesinde kontrol ederek doğrulayarak aşırı sığmayı önlüyoruz. O zaman performansını kontrol etmek için test setinde test etme ihtiyacı nedir? Test setindeki hata, ağ için geçerli …



4
Pandalar artık verilerden daha mı hızlı?
https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping Data.table kıyaslamaları 2014'ten beri güncellenmemiştir. PandasŞimdi daha hızlı bir yerde duydum data.table. Bu doğru mu? Herhangi bir kıyaslama yapan var mı? Daha önce hiç Python kullanmadım ama pandasyenebilirse geçiş yapmayı düşünürdüm data.table?
18 python  r  pandas  data  data.table 


1
ReLU neden diğer aktivasyon fonksiyonlarından daha iyidir?
Burada cevap, benzer sigmoidaktivasyon fonksiyonları olan ama sanırım Relubir dezavantaja sahip olan ve beklenen değeri olan yok olan ve patlayan gradyanları ifade eder . çıkışı için bir sınırlama yoktur Reluve bu nedenle beklenen değeri sıfır değildir. Popülerlik önce hatırlıyorum Reluo tanhmakine ziyade uzmanlar öğrenme arasında en popüler oldu sigmoid. Bunun …

3
MAP @ gösterimi [. 5: .95] ne anlama geliyor?
Tespit için, bir nesne teklifinin doğru olup olmadığını belirlemenin yaygın bir yolu Birlik Üzerinde Kesişimdir (IoU, IU). Bu , önerilen nesne piksellerinin kümesini ve gerçek nesne pikselleri B kümesini alır ve şunları hesaplar:AAABBB IoU(A,B)=A∩BA∪BIoU(A,B)=A∩BA∪BIoU(A, B) = \frac{A \cap B}{A \cup B} Genellikle, IoU> 0.5 bir hit olduğu anlamına gelir, aksi …

2
Doc2Vec - Paragraflar nasıl etiketlenir (gensim)
Ben gensim doc2vec ile cümleler / paragraflar / belgeleri nasıl etiketlemek (etiket) merak ediyorum - pratik bir bakış açısından. Her cümlenin / paragrafın / belgenin kendine özgü etiketi (örneğin "Sent_123") olması gerekiyor mu? "Hangi sözcüklerin veya cümlelerin" Sent_123 "etiketli tek bir cümleyle en çok benzediğini söylemek istiyorsanız bu yararlı görünüyor. …

3
Derin Sinir Ağlarında Torbalama ve Bırakma
Torbalama, tek bir yordayıcı gibi en çok çalışan çoklu yordayıcıların üretilmesidir. Bırakma, tüm olası alt ağları ortalamayı bir sinir ağlarına öğreten bir tekniktir. En önemli Kaggle'ın yarışmalarına bakıldığında, bu iki tekniğin çok sık birlikte kullanıldığı görülmektedir. Gerçek uygulamanın yanında teorik bir fark göremiyorum. Neden her ikisini de gerçek bir uygulamada …


4
Sinir ağında ekstra çıkış katmanı (Ondalıktan ikiliye)
Çevrimiçi kitaptan bir soru üzerinde çalışıyorum: http://neuralnetworksanddeeplearning.com/chap1.html Ek çıkış katmanı 5 çıkış nöronuysa, muhtemelen bir önceki katman için 0.5 ve ağırlıkça 0.5 ağırlık sapması ayarlayabildiğimi anlayabilirim. Ancak soru şimdi dört çıkış nöronunun yeni bir katmanını soruyor - bu da 10 olası çıkışı temsil etmek için fazlasıyla yeterli .24242^{4} Birisi bana …

1
Metin kümeleme için algoritmalar
Çok sayıda cümleyi anlamlarına göre gruplara ayırma problemim var. Bu, çok sayıda cümleniz olduğunda ve anlamlarına göre gruplandırmak istediğinizde bir soruna benzer. Bunu yapmak için hangi algoritmalar öneriliyor? Önceden kümelerin sayısını bilmiyorum (ve daha fazla veri geliyor gibi kümeler de değişebilir), normalde her cümleyi temsil etmek için hangi özellikler kullanılır? …

3
En yakın komşular çok yüksek boyutlu veriler arar
Kullanıcıların ve beğendikleri öğelerin büyük bir seyrek matrisine sahibim (1M kullanıcıları ve 100K öğelerinde, çok düşük bir seviyede sparlite ile). Üzerinde kNN araması yapabileceğim yolları araştırıyorum. Veri setimin boyutu ve yaptığım bazı ilk testler göz önüne alındığında, benim kullanacağım yöntemin ya paralel ya da dağıtılmış olması gerektiği varsayımıdır. Bu yüzden …

6
R'de bir gösterge tablosu oluşturmak için ne kullanıyorsunuz?
Periyodik (günlük, aylık) web analizi gösterge tablosu raporları oluşturmam gerekiyor. Statik olacaktır ve etkileşim gerektirmez, bu nedenle hedef çıktı olarak bir PDF dosyası hayal edin. Raporlar tabloları ve grafikleri (esas olarak ggplot2 ile oluşturulan mini grafik ve madde işareti grafikleri) karıştıracaktır. Stephen Few / Perceptual Edge tarzı panoları düşünün, örneğin: …
17 r  visualization 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.