Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

3
Klasik CV şablonu eşleştirmesi üzerinde görsel inceleme görevi için neden evrişimli NN'ler kullanılır?
Üzerinde çalıştığımız bir projeye dayanarak ilginç bir tartışma yaşadım: neden bir şablon eşleştirme algoritması üzerinde CNN görsel denetim sistemi kullanıyorsunuz? Arka plan: Belirli bir nesne tipi "bozuk" / arızalı veya arızalıysa - bu durumda bir PCB devre kartı olup olmadığını saptayan basit bir CNN görüş sisteminin (web kamerası + dizüstü …


1
Bir evrişimsel kat, sıradan bir evrişimsel ağdan nasıl farklıdır?
Şu anda bu makalenin sonuçlarını yeniden oluşturmak için çalışıyorum . Bu makalede, özelliklerin çıkarılması için CNN kullanımı için bir yöntem açıklanmaktadır ve Dnn-hmm olan ve RBM kullanılarak önceden ölçülen akustik bir modele sahiptir. Bölüm III alt bölümü A, giriş verilerinin farklı şekillerde temsil edilebileceğini belirtir. Statik, delta ve delta deltaların …

4
Karar Ağacını özellik ithalatı bağlamında yorumlama
Sklearn ile oluşturulmuş bir karar ağacı sınıflandırma modelinin karar sürecini tam olarak nasıl anlamaya çalışıyorum. Baktığım 2 ana yön, ağacın bir grafik temsili temsili ve özellik ithalatları listesidir. Anlamadığım şey, özellik öneminin ağaç bağlamında nasıl belirlendiğidir. Örneğin, özellik ithalatlarımın listesi: Özellik sıralaması: 1. FeatureA (0.300237) FeatureB (0.166800) FeatureC (0.092472) FeatureD …

2
Öğrenme hızı neden sinir ağımın ağırlıklarının hızla artmasına neden oluyor?
Tensorflow'u biraz araştırma için basit sinir ağları yazmak için kullanıyorum ve antrenman yaparken 'nan' ağırlıkları ile ilgili birçok sorun yaşadım. Optimize ediciyi değiştirme, kaybı, veri boyutunu vb. Değiştirme gibi birçok farklı çözüm denedim, ancak boşuna. Son olarak, öğrenme oranındaki bir değişikliğin ağırlıklarımda inanılmaz bir fark yarattığını fark ettim. .001 (oldukça …

2
Word2vec'deki sözcük vektörlerinin özellikleri
Duygu analizi yapmaya çalışıyorum. Kelimeleri sözcük vektörlerine dönüştürmek için word2vec modelini kullanıyorum. 'Cümleler' adlı bir listedeki tüm cümleleri kullandığımı ve bu cümleleri aşağıdaki gibi word2vec'e geçirdiğimi varsayalım: model = word2vec.Word2Vec(sentences, workers=4 , min_count=40, size=300, window=5, sample=1e-3) Kelime vektörleri için çaylak olduğum için iki şüphem var. 1- Özellik sayısının 300 olarak …


1
rastgele orman ve doğrusal regresyon yoluyla özellik önemi farklıdır
Özellikleri sıralamak için Kement uygulandı ve aşağıdaki sonuçları aldı: rank feature prob. ================================== 1 a 0.1825477951589229 2 b 0.07858498115577893 3 c 0.07041793111843796 Veri kümesinde 3 etiket bulunduğunu unutmayın. Farklı etiketler için özelliklerin sıralaması aynıdır. Daha sonra aynı veri kümesine rastgele orman uygulandı: rank feature score =================================== 1 b 0.17504808300002753 6 …

3
Yapay sinir ağlarında düzenleyici yöntem seçme
Sinir ağlarını eğitirken, ağı düzenli hale getirmenin en az 4 yolu vardır: L1 Düzenleme L2 Düzenleme Bırakmak Toplu Normalleştirme artı tabii ki ağırlık paylaşımı ve bağlantı sayısının azaltılması gibi, en katı anlamda düzenleyici olmayabilecek diğer şeyler. Peki bu düzenleme yöntemlerinden hangisinin kullanılacağını nasıl seçeriz? "Her şeyi deneyin ve neyin işe …

3
Hangi varsa, makine öğrenme algoritmaları açıklanabilirlik ve tahmin arasında iyi bir denge olarak kabul edilir?
Gradyan yükseltme makineleri veya sinir ağları gibi algoritmaları tanımlayan makine öğrenimi metinleri genellikle bu modellerin tahminlerde iyi olduğunu söyler, ancak bu açıklanabilirlik veya yorumlanabilirlik kaybı pahasına gelir. Tersine, tek karar ağaçları ve klasik regresyon modelleri açıklamada iyi olarak etiketlenir, ancak rastgele ormanlar veya SVM'ler gibi daha karmaşık modellere kıyasla (nispeten) …

3
Kullanıcıların tüm öğelerin yalnızca bir kısmını görebildiği bir durum için hangi öneri motoru?
Belge yönetim sistemine bir öneri özelliği eklemek istiyorum . Şirket belgelerinin çoğunun saklandığı bir sunucudur. Çalışanlar web arayüzüne göz atıyor ve istedikleri belgeleri indirmek (veya çevrimiçi okumak için) tıklıyorlar. Her çalışanın tüm belgelerin bir alt kümesine erişimi vardır: Amacım : Bir çalışanınıza yakın zamanda takım arkadaşları tarafından açılan belgeleri veya …

2
Ortak çalışmaya dayalı filtreleme için karşılaştırma veri kümeleri
Ortak çalışmaya dayalı filtreleme için yeni bir algoritmayı test etmek istiyorum . Tipik bir kullanım durumu, belirli bir kullanıcıya benzer kullanıcıların tercihlerine göre film önerilmesidir. Araştırmacıların algoritmalarını test etmek için sıklıkla kullandıkları bazı karşılaştırmalı değerlendirme veri setleri nelerdir? Computer Vision'da insanların genellikle MNIST veya CIFAR kullandıklarını biliyorum, ancak işbirlikçi filtreleme …

3
Scikit-Learn'de Rastgele Orman Regresöründen ihracat ağırlıkları (formül)
Scytit Learn in Python (Random Forest Regressor) ile bir tahmin modeli geliştirdim ve manuel tahmin için bir excel aracı oluşturmak için her özelliğin ağırlıklarını bir şekilde çıkarmak istiyorum. Bulduğum tek şey, model.feature_importances_ama yardımcı olmuyor. Bunu başarmanın bir yolu var mı? def performRandomForest(X_train, y_train, X_test, y_test): '''Perform Random Forest Regression''' from …

1
SVM ve menteşe kaybı arasındaki ilişki nedir?
Meslektaşım ve ben, lojistik regresyon ve SVM arasındaki fark etrafında başımızı sarmaya çalışıyoruz. Açıkça farklı objektif fonksiyonları optimize ediyorlar. Bir SVM, menteşe kaybını optimize eden ayrımcı bir sınıflandırıcı olduğunu söylemek kadar basit mi? Yoksa bundan daha mı karmaşık? Destek vektörleri nasıl devreye giriyor? Gevşek değişkenler ne olacak? Neden sigmoid aktivasyon …

2
Ayrılmayı ve diğer düzenlemeleri inceleyen çalışmalar var mı?
Tercihen farklı alanlarda (veya en azından farklı veri kümelerinde) nöral ağlar için düzenleme yöntemlerinin farklılıklarını gösteren yayınlanmış makaleler var mı? Soruyorum çünkü şu anda çoğu insanın bilgisayar görüşünde düzenlileştirme için sadece bırakma hissi verdiğini hissediyorum. Farklı düzenleme yöntemleri kullanmak için bir neden olup olmadığını kontrol etmek istiyorum.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.