Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

4
Sınıflandırma kuralları oluşturma algoritması
Bu nedenle, sınıflandırıcılar tarafından çözülen geleneksel sorun alanına oldukça düzgün uyan bir makine öğrenme uygulaması potansiyeline sahibiz, yani, bir öğeyi ve sonuçta ortaya koydukları bir "kovayı" tanımlayan bir dizi özelliğe sahibiz. Bununla birlikte, modeller oluşturmak yerine Naive Bayes veya benzeri sınıflandırıcılarda olduğu gibi, çıktımızın son kullanıcı tarafından incelenebilen ve değiştirilebilen …

2
Hangi LSTM katmanlarında bırakma?
LSTMBırakma ile çok katmanlı bir katman kullanmak , tüm Gizli katmanların yanı sıra Yoğun katmanların çıktısına bırakma yapılması önerilir mi? Hinton'un makalesinde (Bırakmayı önerdi), sadece Yoğun katmanlara Bırakmayı koydu, ancak gizli iç katmanlar kıvrımlıydı. Açıkçası, kendi modelimi test edebilirim, ama bu konuda bir fikir birliği olup olmadığını merak ettim?

3
Sabit olmayan kategorik verilerle nasıl sınıflandırma yapabilirim?
Hem kategorik hem de sayısal verilerle bir sınıflandırma problemim var. Karşılaştığım sorun, kategorik verilerimin sabit olmaması, yani etiketini tahmin etmek istediğim yeni adayın önceden gözlemlenmeyen yeni bir kategoriye sahip olabileceği anlamına geliyor. Örneğin, kategorik verilerim sexolsaydı female, mümkün olan tek etiket maleve otherne olursa olsun olurdu . Ancak, kategorik değişkenim, …

1
Scikit-Learn Label Yayılımını grafik yapılandırılmış verilerde nasıl kullanabilirim?
Araştırmamın bir parçası olarak, grafik üzerinde etiket yayılımı yapmakla ilgileniyorum. Özellikle bu iki yöntemle ilgileniyorum: Xiaojin Zhu ve Zoubin Ghahramani. Etiket yayılımı ile etiketlenmiş ve etiketlenmemiş verilerden öğrenme. Teknik Rapor CMU-CALD-02-107, Carnegie Mellon Üniversitesi, 2002 http://pages.cs.wisc.edu/~jerryzhu/pub/CMU-CALD-02-107.pdf Dengyong Zhou, Olivier Bousquet, Thomas Navin Lal, Jason Weston, Bernhard Schoelkopf. Yerel ve küresel …

5
Denetimsiz görüntü segmentasyonu
Bir düzlem tabloda birkaç nesne ile bir görüntü verilen bir algoritma uygulamaya çalışıyorum, istenen her nesne için segmentasyon maskeleri çıktı. CNN'lerin aksine, buradaki amaç, yabancı bir ortamda nesneleri tespit etmektir. Bu soruna en iyi yaklaşımlar nelerdir? Ayrıca, çevrimiçi olarak kullanılabilecek uygulama örnekleri var mı? Edit: Üzgünüm, soru biraz yanıltıcı olabilir. …

1
Keras'ın çok makineli çok çekirdekli işlemci sisteminde çalışmasını sağlayın
Keras (Theano arka planını kullanarak) LSTM kullanarak Seq2Seq modeli üzerinde çalışıyorum ve ben birkaç MB veri bile eğitim için birkaç saat gerekir, çünkü süreçleri paralelleştirmek istiyorum. GPU'ların paralelleştirmede CPU'lardan çok daha iyi olduğu açıktır. Şu anda yalnızca üzerinde çalışabileceğim CPU'larım var. 16 CPU'ya erişebildim (çekirdek başına 2 iş parçacığı X …

3
Bir hashing vectorizer ve bir tfidf vectorizer arasındaki fark nedir
Her bir belge için bir metin belgeleri grubunu kelime vektörlerine dönüştürüyorum. Ben bir TfidfVectorizer ve bir HashingVectorizer kullanarak denedim A'nın yaptığı gibi puanları HashingVectorizerdikkate almadığını anlıyorum . Hala çalışmamın nedeni , burada ve burada açıklandığı gibi, büyük veri kümeleriyle uğraşırken sağladığı esneklik . (Orijinal veri kümemde 30 milyon belge var)IDFTfidfVectorizerHashingVectorizer …

3
Yapay Sinir Ağları - Kayıp ve Doğruluk korelasyonu
Sinir Ağlarında Kayıp ve Doğruluk metriklerinin bir arada bulunmasıyla biraz kafam karıştı. Her ikisinin de ve karşılaştırmasının "kesinliğini" göstermesi gerekiyor , değil mi? Peki bu ikisinin eğitim dönemlerindeki gereksizliği değil mi? Dahası, neden ilişkilendirilmiyorlar?yyyy^y^\hat{y}

3
TensorFlow tam bir Makine Öğrenim Kütüphanesi midir?
TensorFlow için yeniyim ve TensorFlow'u kullanmadan önce yeteneklerini ve eksikliklerini anlamam gerekiyor. Bunun derin bir öğrenme çerçevesi olduğunu biliyorum, ancak diğer makine öğrenme algoritmalarının tensör akışı ile birlikte kullanabileceğimizden başka. Örneğin, TensorFlow kullanarak SVM'ler veya rastgele ormanlar kullanabilir miyiz? (Bunun çılgınca geldiğini biliyorum) Kısacası, hangi Makine Öğrenimi Algoritmalarının TensorFlow tarafından …

2
Evrişimli Ağlarda önyargı hakkında soru
CNN için kaç ağırlık ve önyargı gerektiğini anlamaya çalışıyorum. Diyelim ki (3, 32, 32) bir resmim var ve (32, 5, 5) bir filtre uygulamak istiyorum. Her özellik haritası için 5x5 ağırlığım var, bu yüzden 3 x (5x5) x 32 parametrem olmalı. Şimdi önyargı eklemem gerekiyor. Sadece (3 x (5x5) + …

4
Hangisi önce: algoritma kıyaslama, özellik seçimi, parametre ayarlama?
Örneğin bir sınıflandırma yapmaya çalışırken yaklaşımım şu anda önce çeşitli algoritmaları deneyin ve kıyaslayın yukarıdaki 1'den en iyi algoritmada özellik seçimi yapın seçili özellikleri ve algoritmayı kullanarak parametreleri ayarlama Ancak, diğer algoritmalar en iyi parametre / en uygun özelliklerle optimize edilmişse, kendimi genellikle seçilen algoritmadan daha iyi bir algoritma olabileceğine …


2
Pyspark'ta kategorik verileri sayısal verilere dönüştürme
Pyspark uygulamaları ile çalışmak için Ipython dizüstü bilgisayar kullanıyorum. Gelir 50k aralığının altında veya altında olup olmadığını belirlemek için çok sayıda kategorik sütun içeren bir CSV dosyası var. Gelir aralığını belirlemek için tüm girdileri alarak bir sınıflandırma algoritması yapmak istiyorum. Eşlenen değişkenler için değişkenler sözlüğü oluşturmak ve değişkenleri işlemek için …

2
Özellik Ölçeklemenin Sonuçları
Şu anda SVM kullanıyorum ve eğitim özelliklerimi [0,1] aralığında ölçeklendiriyorum. Önce eğitim setimi takıyorum / dönüştürüyorum ve daha sonra aynı dönüşümü test setime uyguluyorum. Örneğin: ### Configure transformation and apply to training set min_max_scaler = MinMaxScaler(feature_range=(0, 1)) X_train = min_max_scaler.fit_transform(X_train) ### Perform transformation on testing set X_test = min_max_scaler.transform(X_test) Eğitim …

3
Çok partili sistemde seçim sonucunu hesaplamak için hangi regresyon kullanılır?
Parlamento seçimlerinin sonucunu tahmin etmek istiyorum. Çıktım, her bir tarafın aldığı% olacak. 2'den fazla parti var, bu nedenle lojistik regresyon uygulanabilir bir seçenek değil. Her taraf için ayrı bir gerileme yapabilirdim, ancak bu durumda sonuçlar bir şekilde birbirinden bağımsız olur. Sonuçların toplamının% 100 olmasını sağlamaz. Hangi regresyonu (veya başka bir …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.