«python» etiketlenmiş sorular

Python makine öğrenimi için yaygın olarak kullanılan bir programlama dilidir. Bu etiketi, (a) ya sorunun kritik bir parçası ya da beklenen cevap olarak 'Python' içeren herhangi bir * on-topic * sorusu için kullanın ve (b) `` Python '' un nasıl kullanılacağı hakkında * sadece * değildir.


5
Bir makine öğrenme problemini prototiplemek için hangi programlama dilini önerirsiniz?
Şu anda Octave'de çalışıyor, ancak belgelerin zayıf olması nedeniyle ilerleme çok yavaş. Hangi dili öğrenmek ve kullanmak kolaydır ve makine öğrenimi sorunlarını çözmek için iyi belgelenmiştir? Ben küçük bir veri kümesi üzerinde prototip (binlerce örnek) arıyorum, bu yüzden hız önemli değil. EDIT: Bir öneri motoru geliştiriyorum. Bu nedenle, Düzenli Doğrusal …


4
Çok yüksek boyutsal veriler için PCA nasıl yapılır?
Temel bileşen analizi (PCA) yapmak için, her bir sütunun ortalamalarını verilerden çıkarmanız, korelasyon katsayı matrisini hesaplamanız ve sonra özvektörleri ve özdeğerleri bulmanız gerekir. Daha doğrusu, Python'da uygulamak için yaptığım şey, sadece korelasyon katsayısı matrisini (corrcoef) bulma yöntemi yüksek boyutsallığa sahip bir dizi kullanmama izin vermediği için sadece küçük matrislerle çalışıyor. …
12 pca  python 

1
(Pandalar) otokorelasyon grafiği neyi gösterir?
Ben bir acemiyim ve otokorelasyon grafiğinin ne gösterdiğini anlamaya çalışıyorum. Burada bahsetmediğim , bu sayfa veya ilgili Wikipedia sayfası gibi farklı kaynaklardan çeşitli açıklamalar okudum . Bir yıl için dizinimde tarihleri ​​olan ve değerler her dizin için 0'dan 365'e yükselen bu çok basit koda sahibim .. ( 1984-01-01:0, 1984-01-02:1 ... …

2
Kolmogorov – Smirnov testi: p-değeri ve ks-test istatistiği örneklem büyüklüğü arttıkça azalır
P-değerleri ve ks-test istatistikleri, artan örneklem büyüklüğü ile neden azalıyor? Bu Python kodunu örnek olarak alalım: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Sonuçlar: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) Ks_2sampResult(statistic=0.080000000000000071, …


8
Yüksek boyutlu verileri görselleştirme
Yüksek boyutlu uzayda vektör olan iki sınıftan örneklerim var ve bunları 2D veya 3D olarak çizmek istiyorum. Boyut azaltma teknikleri hakkında biliyorum, ama gerçekten basit ve kullanımı kolay bir araç (matlab, python veya önceden oluşturulmuş bir .exe) gerekir. Ayrıca merak ediyorum 2D temsil "anlamlı" olacak? (Örneğin, iki sınıf nasıl kesişebilir …

1
Python'da bir scree arsa nasıl çizilir? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. Geçen yıl kapalı . Bir matris üzerinde tekil vektör ayrışımı kullanıyorum ve U, S ve Vt matrislerini elde ediyorum. Bu noktada, elde edilecek boyutların sayısı …

2
Çok boyutlu verileri (LSI) 2B olarak görüntüleme
Belgeler arasındaki benzerlikleri bulmak için gizli anlamsal indeksleme kullanıyorum ( teşekkürler, JMS! ) Boyut küçültmeden sonra, belgeleri çok iyi çalışan kümeler halinde gruplamak için k-ortalama kümelemeyi denedim. Ama biraz daha ileri gitmek ve belgeleri herhangi bir iki düğüm arasındaki mesafenin benzerlikleriyle ters orantılı olduğu bir düğüm kümesi olarak görselleştirmek istiyorum …

1
R / mgcv: te () ve ti () tensör ürünleri neden farklı yüzeyler üretir?
mgcvİçin paket Rtensör ürün etkileşimleri uydurma için iki işlevi vardır: te()ve ti(). İkisi arasındaki temel işbölümünü anlıyorum (doğrusal olmayan bir etkileşime uymak ve bu etkileşimi ana etkilere ve etkileşime ayırmak). Anlamadığım şey neden te(x1, x2)ve ti(x1) + ti(x2) + ti(x1, x2)(biraz) farklı sonuçlar üretebilir. MWE (uyarlanmıştır ?ti): require(mgcv) test1 <- …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

4
Python'da Temel Bileşen Analizi ve Regresyon
SAS'ta yaptığım bazı çalışmaları Python'da nasıl çoğaltılacağını anlamaya çalışıyorum. Çoklu doğrusallığın bir sorun olduğu bu veri kümesini kullanarak Python'da temel bileşen analizi yapmak istiyorum. Scikit-learn ve istatistik modellerine baktım, ancak çıktılarını nasıl alacağımı ve SAS ile aynı sonuç yapısına nasıl dönüştüğünü bilmiyorum. Birincisi, SAS, kullandığınızda korelasyon matrisinde PCA yapıyor gibi …

2
Bir algılayıcı için karar sınırı grafiği
Bir algılayıcı algoritmasının karar sınırını çizmeye çalışıyorum ve birkaç şey hakkında gerçekten kafam karıştı. Giriş örneklerim , temelde bir 2D giriş örneği ( ve ) ve bir ikili sınıf hedef değeri ( ) [1 biçimindedir. veya 0].[(x1,x2),y][(x1,x2),y][(x_{1},x_{2}), y]x1x1x_{1}x2x2x_{2}yyy Ağırlık vektörüm şu şekildedir: .[w1,w2][w1,w2][w_{1}, w_{2}] Şimdi ek bir bias parametresi ve …

1
Rastgele Orman regresörü veya sınıflandırıcı seçmeli miyim?
Ben rastgele orman tarafından bir ikili hedef sınıf ile bir veri kümesi sığdırmak. Python'da bunu randomforestclassifier veya randomforestregressor ile yapabilirim. Sınıflandırmayı doğrudan randomforestclassifier'dan alabilirim veya önce randomforestregressor'u çalıştırabilir ve bir dizi tahmini puan geri alabilirim (sürekli değer). Sonra tahmin sınıfları puan kümesinden türetmek için bir kesme değeri bulabilirim. Her iki …

3
Neden 1'den büyük bilgi entropisi alıyorum?
Entropiyi hesaplamak için aşağıdaki işlevi uyguladım: from math import log def calc_entropy(probs): my_sum = 0 for p in probs: if p > 0: my_sum += p * log(p, 2) return - my_sum Sonuç: >>> calc_entropy([1/7.0, 1/7.0, 5/7.0]) 1.1488348542809168 >>> from scipy.stats import entropy # using a built-in package # give …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.