«scikit-learn» etiketlenmiş sorular

scikit-learn, makine öğrenimine odaklanarak veri analizi ve veri madenciliği için basit ve verimli araçlar sağlayan Python için bir makine öğrenimi kitaplığıdır. Herkes tarafından erişilebilir ve çeşitli bağlamlarda yeniden kullanılabilir. NumPy ve SciPy üzerine inşa edilmiştir. Proje açık kaynaklıdır ve ticari olarak kullanılabilir (BSD lisansı).

20
Scikit-learn'da birden çok sütun üzerinde etiket kodlaması
Scikit-learn'ın dize etiketlerinin LabelEncoderbir panda kodlamak için kullanmaya çalışıyorum DataFrame. Dataframe birçok (50+) sütun olduğundan, LabelEncoderher sütun için bir nesne oluşturmaktan kaçınmak istiyorum ; Tüm veri sütunlarımda LabelEncoderçalışan tek bir büyük nesneye sahip olmayı tercih ederim . Tümünün DataFrameiçine LabelEncoderatılması aşağıdaki hatayı oluşturur. Burada kukla veriler kullandığımı lütfen unutmayın; Aslında …


6
Scikit-learn'da sınıflandırıcıyı diske kaydedin
Nasıl eğitimli bir tasarruf yapmak sınıflandırıcı Naif Bayes için diske ve için kullanabilirsiniz tahmin verileri? Scikit-learn web sitesinden aşağıdaki örnek program var: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" % (iris.target != …

15
ImportError: sklearn.cross_validation adlı modül yok
Ubuntu 14.04'te python 2.7 kullanıyorum. Scikit-learn, numpy ve matplotlib'i şu komutlarla kurdum: sudo apt-get install build-essential python-dev python-numpy \ python-numpy-dev python-scipy libatlas-dev g++ python-matplotlib \ ipython Ancak bu paketleri içe aktardığımda: from sklearn.cross_validation import train_test_split Bana şu hatayı döndürür: ImportError: No module named sklearn.cross_validation Ne yapmam gerekiyor?





10
RuntimeWarning: numpy.dtype boyutu değişti, ikili uyumsuzluğu gösterebilir
Kaydedilmiş bir SVM modelini yüklemeye çalışırken bu hatayı alıyorum. Sklearn, NumPy ve SciPy'yi kaldırmayı, en son sürümleri tekrar tekrar yüklemeyi (pip kullanarak) denedim. Hala bu hatayı alıyorum. Neden? In [1]: import sklearn; print sklearn.__version__ 0.18.1 In [3]: import numpy; print numpy.__version__ 1.11.2 In [5]: import scipy; print scipy.__version__ 0.18.1 In …


5
Veriler 3 sete nasıl bölünür (tren, doğrulama ve test)?
Bir panda veri çerçevem ​​var ve bunu 3 ayrı sete bölmek istiyorum. Ben kullanarak biliyorum train_test_split gelen sklearn.cross_validationbir iki set (tren ve test) verileri bölebilirsiniz. Ancak, verileri üç sete bölme konusunda herhangi bir çözüm bulamadım. Tercihen, orijinal verilerin endekslerine sahip olmak istiyorum. Bir çözümün train_test_splitiki kez kullanmak ve bir şekilde …

6
sklearn ile ölçeklenen pandalar veri çerçevesi sütunları
Karışık tip sütunlara sahip bir panda veri çerçevem ​​var ve sklearn'ın min_max_scaler'ını bazı sütunlara uygulamak istiyorum. İdeal olarak, bu dönüşümleri yerinde yapmak isterdim, ancak bunu yapmanın bir yolunu henüz bulamadım. Çalışan şu kodu yazdım: import pandas as pd import numpy as np from sklearn import preprocessing scaler = preprocessing.MinMaxScaler() dfTest …

13
sklearn hatası ValueError: Giriş, NaN, infinity veya dtype için çok büyük bir değer içeriyor ('float64')
Sklearn kullanıyorum ve afinite yayılımıyla ilgili bir sorun yaşıyorum. Bir girdi matrisi oluşturdum ve şu hatayı alıyorum. ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). Koştum np.isnan(mat.any()) #and gets False np.isfinite(mat.all()) #and gets True Kullanmayı denedim mat[np.isfinite(mat) == True] = 0 sonsuz değerleri kaldırmak için ama …


6
RandomForestClassifier'daki feature_importances nasıl belirlenir?
Veri girişi olarak bir zaman serisine sahip bir sınıflandırma görevim var, burada her bir öznitelik (n = 23) zamanda belirli bir noktayı temsil ediyor. Mutlak sınıflandırma sonucunun yanı sıra, hangi niteliklerin / tarihlerin sonuca ne ölçüde katkıda bulunduğunu öğrenmek istiyorum. Bu nedenle ben sadece feature_importances_benim için iyi çalışan kullanıyorum . …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.