«python» etiketlenmiş sorular

Python makine öğrenimi için yaygın olarak kullanılan bir programlama dilidir. Bu etiketi, (a) ya sorunun kritik bir parçası ya da beklenen cevap olarak 'Python' içeren herhangi bir * on-topic * sorusu için kullanın ve (b) `` Python '' un nasıl kullanılacağı hakkında * sadece * değildir.

2
Scikit-learn'un çoklu etiket sınıflandırıcılarında çapraz doğrulama işlevlerini kullanma
Ben 5 sınıf vardır ve her örnek bu sınıflardan biri veya daha fazla olabilir bir veri kümesi üzerinde farklı sınıflandırıcılar test ediyorum, bu yüzden özellikle scikit-learn çok etiketli sınıflandırıcılar kullanıyorum sklearn.multiclass.OneVsRestClassifier. Şimdi kullanarak çapraz doğrulama yapmak istiyorum sklearn.cross_validation.StratifiedKFold. Bu, aşağıdaki hatayı üretir: Traceback (most recent call last): File "mlfromcsv.py", line …

2
Python matplotlib kutu grafiğindeki keneler nasıl adlandırılır
Kilitli . Bu soru ve cevapları kilitlidir çünkü soru konu dışıdır, ancak tarihsel önemi vardır. Şu anda yeni yanıtları veya etkileşimleri kabul etmiyor. Python matplotlib bir boxplot komutuna sahiptir . Normalde, grafiğin tüm kısımları sayısal olarak işaretlenir. Keneleri konumlar yerine adlarla nasıl değiştirebilirim? Örnek olarak, bu kutu grafiğinde olduğu gibi …

4
Uç durumlarda hassaslık ve geri çağırma için doğru değerler nelerdir?
Hassasiyet şu şekilde tanımlanır: p = true positives / (true positives + false positives) Gibi, bu doğru mu true positivesve false positiveshassas 1 yaklaşır yaklaşım 0? Hatırlama için aynı soru: r = true positives / (true positives + false negatives) Şu anda bu değerleri hesaplamam gereken bir istatistiksel test uyguluyorum …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
Bir korelasyon matrisinin kümelenmesi
Her öğenin diğer öğeyle nasıl ilişkilendirildiğini belirten bir korelasyon matrisim var. Dolayısıyla bir N maddesi için zaten bir N * N korelasyon matrisi var. Bu korelasyon matrisini kullanarak, K bölmesindeki Nk Öğelerinin aynı şekilde davrandığını söyleyebilmem için M bölmelerindeki N öğelerini nasıl kümeleyebilirim. Lütfen bana yardım et. Tüm öğe değerleri …


1
Doğrusal regresyonda dairesel öngörücülerin kullanımı
Rüzgar verilerini (0, 359) ve günün saatini (0, 23) kullanarak bir model yerleştirmeye çalışıyorum, ancak kendilerinin doğrusal parametreler olmadıkları için doğrusal bir regresyona zayıf bir şekilde sığacaklarından endişeliyim. Onları Python kullanarak dönüştürmek istiyorum. En azından rüzgar durumunda, bir sürü değil, derecelerin günahını ve cos'unu alarak bir vektörün hesaplanmasından bahsetmiştim. Yararlı …

3
Julia: Nasıl yapıldığını değerlendirmek
Bu gönderi hızla değişen bir olayla ilgilidir. Çeşitli İstatistiksel Çalışmalar için R / Python'a alternatif olarak Julia hakkında çok iyi bir tartışma yaşayan 2012 sorusu ile karşılaştım. İşte 2012'den Julia'nın vaadiyle ilgili orijinal Soru yatıyor Ne yazık ki Julia o zamanlar çok yeniydi ve istatistiksel çalışma için gerekli araç takımları …
19 r  python  computing  julia 

3
Verilerin istatistiksel olarak anlamlı olması nasıl simüle edilir?
10. sınıftayım ve makine öğrenimi science fair projesi için veri simülasyonu yapmak istiyorum. Son model hasta verileri üzerinde kullanılacak ve haftanın belirli zamanları arasındaki korelasyonu ve bunun tek bir hastanın verileri içindeki ilaç uyumu üzerindeki etkisini öngörecektir. Bağlılık değerleri ikili olacaktır (0 ilacı almadığı, 1 anlamına geldiği anlamına gelir). Haftanın …

3
Lojistik regresyon katsayılarının standart hatalarını hesaplama
Lojistik regresyonu eğitmek ve test etmek için Python'un scikit-learn'u kullanıyorum. scikit-learn, regresyonun bağımsız değişkenlerin katsayılarını döndürür, ancak katsayıların standart hatalarını sağlamaz. Her katsayı için Wald istatistiği hesaplamak ve bu katsayıları birbirleriyle karşılaştırmak için bu standart hatalara ihtiyacım var. Bir lojistik regresyon katsayıları için standart hataların nasıl hesaplanacağına dair bir açıklama …

3
Python'daki collinear değişkenleri sistematik olarak nasıl kaldırırım? [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu , Çapraz Doğrulanmış için konuyla ilgili olacak şekilde güncelleyin . 2 yıl önce kapalı . Şimdiye kadar, korelasyon tablolarına bakarak ve belirli bir eşiğin üzerindeki değişkenleri kaldırarak veri hazırlama sürecinin bir parçası olarak …

3
N başarılı olana kadar döndürmeleri nasıl modelleyebilirim?
Sen ve ben sırayla bozuk para çeviren bir oyun oynamaya karar veriyoruz. Toplamda 10 kafa çeviren ilk oyuncu oyunu kazanır. Doğal olarak, önce kimin gitmesi gerektiği konusunda bir tartışma var. Bu oyunun simülasyonları, ilk çeviren oyuncunun ikinci çeviren oyuncudan% 6 daha fazla kazandığını göstermektedir (ilk oyuncu zamanın yaklaşık% 53'ünü kazanır). …


2
Zaman serisi tahminini otomatikleştirmek mümkün müdür?
Herhangi bir zaman serisini analiz edebilecek ve analiz edilen zaman serisi verileri için en iyi geleneksel / istatistiki tahmin yöntemini (ve parametrelerini) seçebilecek bir algoritma oluşturmak istiyorum. Böyle bir şey yapmak mümkün mü? Cevabınız evet ise, bana bu konuya nasıl yaklaşılacağı konusunda bazı ipuçları verebilir misiniz?

1
Jenks Python Doğal Molalar: Optimum mola sayısı nasıl bulunur?
Bulduğum bu Python uygulaması arasında Jenks Doğal Sonları algoritma ve bunu benim Windows 7 makine üzerinde çalıştırmak yapabiliriz. Oldukça hızlı ve coğrafi verilerimin boyutunu göz önünde bulundurarak araları birkaç kez bulur. Verilerim için bu kümeleme algoritmasını kullanmadan önce sklearn.clustering.KMeans (burada) algoritma kullanıyordum. KMeans ile yaşadığım problem, optimum K değeri parametresini …

2
Rastgele Ormanlarla özellik seçimi
Çoğunlukla yüksek derecede korelasyonlu ve çok gürültülü (örneğin teknik göstergeler) çoğunlukla finansal değişkenlere (120 özellik, 4k örnek) sahip bir veri setim var, bu yüzden model eğitimi (ikili sınıflandırma) ile daha sonra kullanmak üzere maksimum 20-30'u seçmek istiyorum - artış azalış). Özellik sıralaması için rastgele ormanlar kullanmayı düşünüyordum. Bunları tekrar tekrar …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.