Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

1
Kaç LSTM hücresi kullanmalıyım?
Kullanmam gereken minimum, maksimum ve "makul" miktarda LSTM hücresi ile ilgili herhangi bir temel kural (veya gerçek kurallar) var mı? Özellikle ben ilişkin am BasicLSTMCell TensorFlow ve gelen num_unitsmülk. Lütfen şu şekilde tanımlanan bir sınıflandırma sorunum olduğunu varsayalım: t - number of time steps n - length of input vector …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

2
VC boyutu nasıl hesaplanır?
Makine öğrenimi okuyorum ve VC boyutunu nasıl hesaplayacağımı bilmek istiyorum. Örneğin: h ( x ) = { 10Eğer bir≤x≤bBaşka h(x)={1if a≤x≤b0else h(x)=\begin{cases} 1 &\mbox{if } a\leq x \leq b \\ 0 & \mbox{else } \end{cases} ( a , b ) ∈ R ' 2 , parametreleriyle .( a , b …

2
Python Pandalarda iki veri çerçevesini nasıl birleştiririm?
İki veri çerçevesi df1 ve df2 var ve bunları tek bir veri çerçevesinde birleştirmek istiyorum. Sanki df1 ve df2, tek bir veri çerçevesini merkezden dikey olarak bölerek yaratılmış gibi, sütunların yarısının bir kağıda geçmesi ve sütunların yarısının diğerine geçmesi için bir liste içeren bir kağıdın ikiye bölünmesi gibi. Onları bir …
12 pandas 

2
FPGrowth, sık sık kalıp madenciliğinde hala “son teknoloji” olarak kabul ediliyor mu?
Sıkça Desen Madenciliği (FPM) problemini çözmek için algoritma geliştirmeyi bildiğim kadarıyla, iyileştirme yolunun bazı ana kontrol noktaları var. İlk olarak, Apriori algoritması 1993 yılında Agrawal ve ark. , sorunun resmileştirilmesiyle birlikte. Algoritma mümkün şerit kapalı bir miktar setleri 2^n - 1setleri (Powerset) verileri korumak için bir kafes kullanılarak gerçekleştirilir. Yaklaşmanın …

2
Büyük veri kümesi için etkili boyutsallık azaltma
~ 1M satır ve ~ 500K seyrek özelliklere sahip bir veri setim var. 1K-5K yoğun özellik sırasına göre boyutlandırmayı bir yere azaltmak istiyorum. sklearn.decomposition.PCAseyrek veriler üzerinde çalışmaz ve kullanmayı denedim sklearn.decomposition.TruncatedSVDama oldukça hızlı bir şekilde bellek hatası alıyorum. Bu ölçekte etkili boyutsallık azaltma seçeneklerim nelerdir?

1
CPU kullanımı ve belleğinde scikit-learn n_jobs parametresi
Scikit-learn hakkındaki çoğu tahmin edicide, paralel işler oluşturmak için / yöntemlerinde bir n_jobsparametre vardır . Sadece 1 Python işlemi oluşturduğunu ve çekirdekleri maksimuma çıkardığını ve CPU kullanımının% 2500'e ulaşmasına neden olduğunu fark ettim . Bu, ~% 100 kullanımda birden fazla Python işlemi oluşturan pozitif 1 tamsayı> 1'e ayarlamaktan oldukça farklıdır.fitpredictjoblib-1 …


3
Bir pyspark veri çerçevesindeki tüm sayısal değerleri sabit bir değerle değiştirme
'Null' öğeler ve sayısal öğelerden oluşan bir pyspark veri çerçevesi düşünün. Genel olarak, sayısal elemanlar farklı değerlere sahiptir. Veri çerçevesinin tüm sayısal değerlerini sabit bir sayısal değerle değiştirmek nasıl mümkündür (örneğin, 1 değeriyle)? Şimdiden teşekkürler! Pyspark veri çerçevesi örneği: 123c10.04- 1n u l lc21n u l l1.2c31.35- 1.2n u l …


4
Occam'ın Razor prensibi Makine öğreniminde nasıl çalışır?
Görüntüde gösterilen aşağıdaki soru yakın zamanda yapılan sınavlardan birinde sorulmuştur. Occam'ın Razor prensibini doğru anladığımdan emin değilim. Soruda verilen dağılımlara ve karar sınırlarına göre ve Occam'ın Tıraş Makinesi'ni takip eden her iki durumda da karar sınırı B olmalıdır. Çünkü Occam'ın Razor'una göre, karmaşık olandan ziyade iyi bir iş yapan daha …

3
Python için kullanıma hazır iyi dil modelleri var mı?
Ben bir uygulama prototip ve bazı oluşturulan cümleler üzerinde şaşkınlık hesaplamak için bir dil modeline ihtiyacım var. Python'da kolayca kullanabileceğim eğitimli bir dil modeli var mı? Gibi basit bir şey model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

1
Keras ile zaman ufkunun gelecekteki değerlerini nasıl tahmin edebilirim?
Bu LSTM sinir ağını Keras ile kurdum import numpy as np import pandas as pd from sklearn import preprocessing from keras.layers.core import Dense, Dropout, Activation from keras.activations import linear from keras.layers.recurrent import LSTM from keras.models import Sequential from matplotlib import pyplot #read and prepare data from datafile data_file_name = "DailyDemand.csv" …

1
Önceden eğitilmiş bir CNN sınıflandırıcı kullanarak ve farklı bir görüntü veri kümesine uygulayın
Nasıl olur optimize bir ön eğitimli neural network ayrı probleme uygulamak için? Önceden eğitilmiş modele daha fazla katman ekler ve veri kümenizde test eder misiniz? Örneğin, görev duvar kağıdı gruplarını sınıflandırmak için bir CNN kullanmaksa , her ikisi de görüntü sınıflandırıcıları olmasına rağmen, görüntü kedileri ve köpekleri üzerinde eğitilmiş önceden …

2
% 100 model doğruluğu örnek dışı veri taşması mı?
Ben cognitiveclass.ai R dersi için makine öğrenimini tamamladım ve randomforests ile denemeye başladım. R "randomForest" kütüphanesini kullanarak bir model yaptım. Model iyi ve kötü iki sınıfla sınıflandırır. Bir modelin aşırıya kaçması durumunda, kendi eğitim setindeki veriler üzerinde iyi performans gösterdiğini, ancak örnek dışı veriler üzerinde kötü performans gösterdiğini biliyorum. Modelimi …

3
Sinir ağları - En çok benzer görselleri bulun
Python, scikit-learn ve keras ile çalışıyorum. Aşağıdakiler gibi 3000 binlerce ön yüzlü saat resmim var: Watch_1 , Watch_2 , Watch_3 . Yukarıdaki fotoğraflardan daha az ideal koşullarda (farklı arka plan rengi, daha koyu yıldırım vb.) Alınan gerçek bir saatin fotoğrafını girdi olarak alan bir program yazmak ve 3000 saat arasında …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.