«python» etiketlenmiş sorular

Python makine öğrenimi için yaygın olarak kullanılan bir programlama dilidir. Bu etiketi, (a) ya sorunun kritik bir parçası ya da beklenen cevap olarak 'Python' içeren herhangi bir * on-topic * sorusu için kullanın ve (b) `` Python '' un nasıl kullanılacağı hakkında * sadece * değildir.

25
Bir istatistik tezgah olarak Python
Birçok insan, istatistik ihtiyaçları için Excel veya başka bir elektronik tablo, SPSS, Stata veya R gibi bir ana araç kullanır. Çok özel ihtiyaçlar için belirli bir pakete yönelebilirler, ancak basit bir elektronik tablo veya genel istatistik paketi veya istatistik programlama ortamıyla birçok şey yapılabilir. Python'u her zaman bir programlama dili …
355 r  spss  stata  python 

4
Sinir ağında parti büyüklüğü nedir?
Python Keras packageSinir ağı için kullanıyorum . Bu bağlantı . Is batch_sizetesti numune sayısına eşittir? Wikipedia'dan şu bilgilere sahibiz : Bununla birlikte, diğer durumlarda, toplam gradyanı değerlendirmek, tüm summand işlevlerinden gradyanların pahalı değerlendirmelerini gerektirebilir. Eğitim seti muazzam olduğunda ve basit formüller olmadığında, gradyanların toplamını değerlendirmek çok pahalı olur çünkü gradyanı …

2
Yapay sinir ağına gömme katmanı nedir?
Birçok sinir ağı kütüphanesinde, Keras veya Lasagne'de olduğu gibi 'katmanları gömmek' vardır . Belgeleri okuduğumuza rağmen işlevini anladığımdan emin değilim. Örneğin, Keras belgelerinde şöyle yazıyor: Pozitif tamsayıları (indeksleri) sabit büyüklükteki vektörlere dönüştürün, örn. [[4], [20]] -> [[0.25, 0.1], [0.6, -0.2]] Bilgili bir kişi ne yaptığını ve ne zaman kullanacağınızı açıklayabilir …

3
Bir örnek: ikili sonuç için glmnet kullanarak LASSO regresyonu
Ben kullanımı ile serpmek başlıyorum glmnetile LASSO Regresyon ilgi benim sonuç dikotom olduğunu. Aşağıda küçük bir sahte veri çerçevesi oluşturdum: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

9
Zaman serisindeki anomalileri tespit etmek için hangi algoritmayı kullanmalıyım?
Arka fon Network Operations Center'da çalışıyorum, bilgisayar sistemlerini ve performanslarını izliyoruz. İzlenecek kilit ölçütlerden biri, şu anda sunucularımıza bağlı bir dizi ziyaretçi \ müşterisidir. Bunu görünür kılmak için (Ops ekibi) zaman serisi verileri gibi metrikleri topluyoruz ve grafikler çiziyoruz. Grafit bunu yapmamızı sağlıyor, ani düşüşler (çoğunlukla) ve diğer değişiklikler meydana …

1
Çapraz doğrulama, öğrenme eğrisi ve son değerlendirme için veri setinin nasıl bölüneceği?
Veri kümesini bölmek için uygun bir strateji nedir? Ben şu yaklaşıma ilgili görüşlerinizi (değil gibi bireysel parametrelere test_sizeveya n_iterama kullanılırsa X, y, X_train, y_train, X_test, ve y_testuygun bir şekilde ve sıra mantıklı ise): ( bu örneği scikit-learn belgelerinden uzatarak) 1. Veri kümesini yükleyin from sklearn.datasets import load_digits digits = load_digits() …

5
Yapay sinir ağlarında çoklu sınıf, çoklu etiket sınıflandırma görevleri için hangi kayıp fonksiyonu?
Bir dizi nesneyi n sınıflarına ayırmak için sinir ağını eğitiyorum. Her nesne aynı anda birden fazla sınıfa ait olabilir (çoklu sınıf, çoklu etiket). Çok sınıflı problemlerde genellikle mse yerine kayıp fonksiyonu olarak softmax ve kategorik çapraz entropinin kullanılması önerildiğini ve nedenini az çok anladığımı okudum. Çoklu etiket problemim için, her …

9
R ve Python veri biliminde birbirlerini nasıl tamamlar?
Birçok öğreticide veya kılavuzda anlatı, R ve python'un analiz sürecinin tamamlayıcı bileşenleri olarak bir arada bulunduğunu ima ediyor gibi görünmektedir. Eğitimsiz gözlerime göre, iki dil de aynı şeyi yapıyor gibi görünüyor. Öyleyse benim sorum şu ki, iki dil için gerçekten özel nişler var mı, yoksa birisini mi yoksa diğerini mi …
54 r  python  software 

10
Python kullanarak Makine Öğrenmesi
Makine Öğrenimi deneylerimi yapmak için Python kütüphanelerini kullanmayı düşünüyorum. Şimdiye kadar WEKA'ya güveniyordum, ama genel olarak oldukça memnun kaldım. Bunun temel nedeni WEKA'nın o kadar iyi desteklenmediğini tespit etmem (çok az örnek, dokümantasyon seyrek ve topluluk desteği benim deneyimimden daha az isteniyor) ve kendimi yapışkan durumlarda kendime yardım etmeden bulmam. …


5
SVM özellik ağırlıkları nasıl yorumlanır?
Doğrusal bir SVM yerleştirerek verilen değişken ağırlıkları yorumlamaya çalışıyorum. (Ben scikit-learn kullanıyorum ): from sklearn import svm svm = svm.SVC(kernel='linear') svm.fit(features, labels) svm.coef_ Belgelerde, bu ağırlıkların nasıl hesaplandığını veya yorumlandığını gösteren hiçbir şey bulamıyorum. Kilo işaretinin dersle ilgisi var mı?

2
Pandalar / Statsmodel / Scikit-öğren
Pandalar, Statsmodels ve Scikit-makine öğrenmesi / istatistiksel işlemlerin farklı uygulamalarını mı öğreniyorlar ya da bunlar birbirlerini tamamlayıcı mı? Bunlardan hangisi en kapsamlı işlevselliğe sahiptir? Hangisi aktif olarak geliştirilir ve / veya desteklenir? Lojistik regresyon uygulamak zorundayım. Bunlardan hangisine kullanmam gerektiği konusunda herhangi bir öneriniz var mı?

6
Neden% 100 doğrulukta karar ağacı alıyorum?
Karar ağacım için% 100 doğruluk elde ediyorum. Neyi yanlış yapıyorum? Bu benim kodum: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation import train_test_split x_train = x[0:2635] x_test = x[0:658] y_train …

4
Verilerin iki eğilimi vardır; bağımsız trend çizgileri nasıl çıkarılır?
Belirli bir şekilde sıralanmamış bir veri kümesine sahibim, ancak açıkça çizildiğinde iki farklı eğilime sahiptir. İki seri arasındaki net ayrım nedeniyle basit bir doğrusal regresyon burada yeterli olmaz. İki bağımsız doğrusal trend çizgisini elde etmenin basit bir yolu var mı? Kayıt için Python kullanıyorum ve makine öğrenimi de dahil olmak …

1
Geçici Ağda Link Anomalisi Tespiti
Trend konularını tahmin etmek için link anomalisi tespitini kullanan bu makaleyle karşılaştım ve inanılmaz derecede ilgi çekici buldum: “Sosyal Bağlantılarda Yeni Gelişen Konuları Link Anomalisi Tespiti ile Keşfetmek” . Farklı bir veri setinde çoğaltmayı çok isterdim, ama onları nasıl kullanacaklarını bilecek yöntemlere yeterince aşina değilim. Diyelim ki altı aylık bir …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.