«python» etiketlenmiş sorular


8
Scikit_learn modellerinde fit ile fit_transform arasındaki fark nedir?
Veri bilimine yeniyim fitve fit_transformscikit-learn'deki yöntemler ile yöntem arasındaki farkı anlamıyorum . Herhangi biri neden verileri dönüştürmemiz gerektiğini açıklayabilir mi? Eğitim verisine uydurma modeli ve test verisine dönüştürme ne demektir? Örneğin, kategorik değişkenleri trende sayılara dönüştürmek ve yeni özellik setini test verisine dönüştürmek anlamına mı geliyor?

15
Makine öğrenmesi için Python vs R
Daha yeni akademik amaçlı bir makine öğrenme uygulaması geliştirmeye başladım . Şu anda R kullanıyorum ve kendimi eğitiyorum. Ancak birçok yerde Python'u kullanan insanlar gördüm . Akademi ve endüstride insanlar ne kullanıyor ve tavsiye nedir?

11
Scikit öğrenme kullanarak SVM sonsuz çalışır ve yürütmeyi asla tamamlamaz
595605 satır ve 5 sütun (özellikler) içeren bir eğitim veri setinde scikit learn (python) ve 397070 satır içeren test veri setinde SVR kullanmaya çalışıyorum. Veriler önceden işlenmiş ve düzenlenmiştir. Test örneklerini başarılı bir şekilde çalıştırabilirim ancak veri setimi kullanarak çalıştırmaya başladım ve bir saatten fazla çalışmasına izin verdiğimde, programın herhangi ...

1
Pandalarda isna () ve isnull () arasındaki fark
Bir süredir pandaları kullanıyorum. Fakat pandalar arasındaki isna()ve isnull()arasındaki farkın ne olduğunu anlamadım . Ve, daha önemlisi, veri çerçevesindeki eksik değerleri belirlemek için hangisinin kullanılması gerektiği. Bir değerin nasıl ya nada olarak tespit edilmesinin temelinde yatan temel fark nedir null?

6
karar ağacı / rastgele ormandaki özellikler olarak karakter dizileri
Karar ağacı / rastgele orman uygulamasında bazı problemler yaşıyorum. Sayı gibi karakter dizileri (ülke adı gibi) özellikli bir soruna uymaya çalışıyorum. Şimdi, kütüphane, scikit-learn sadece sayı olarak parametre alır, fakat önemli miktarda bilgi taşıdıkları gibi dizeleri de enjekte etmek istiyorum. Böyle bir senaryoyu nasıl idare ederim? Python'da karma gibi bazı ...

8
Python'da açık kaynaklı Anomali Tespiti
Sorun Arka Planı: BT izleme alanında bulunanlara benzer günlük dosyaları içeren bir proje üzerinde çalışıyorum (BT alanını en iyi anladığım kadarıyla). Bu günlük dosyaları, yüzlerce / binlerce sıradaki çeşitli parametreler halinde düzenlenmiş zaman serisi verileridir. Her parametre sayısaldır (kayan nokta) ve her zaman noktası için önemsiz / hata olmayan bir ...

2
Bir RNN'nin Keras'ta farklı uzunluktaki örneklerle eğitimi
RNN'ler hakkında bilgi almaya başladım ve Keras kullanıyorum. Vanilya RNN ve LSTM katmanlarının temel öncülünü anlıyorum, ancak eğitim için belirli bir teknik noktayı anlamakta güçlük çekiyorum. Gelen keras belgeler , bir RYSA katmanına girdi şekline sahip olmalıdır diyor (batch_size, timesteps, input_dim). Bu, tüm eğitim örneklerinin sabit bir sekans uzunluğuna sahip ...
60 python  keras  rnn  training 

8
Kümelenme coğrafi konum koordinatları (enlem, uzun çiftler)
Coğrafi konum kümelenmesi için doğru yaklaşım ve kümeleme algoritması nedir? Coğrafi konum koordinatlarını kümelemek için aşağıdaki kodu kullanıyorum: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y = kmeans2(whiten(coordinates), 3, iter = 20) plt.scatter(coordinates[:,0], ...

9
Python kullanarak tekrarlanabilir veri bilimi için araçlar ve protokol
Python kullanarak bir veri bilimi projesi üzerinde çalışıyorum. Projenin birkaç aşaması var. Her aşama, Python scriptleri, yardımcı veriler, konfigürasyon ve parametreler kullanılarak bir veri seti almak ve başka bir veri seti oluşturmaktan oluşur. Kodu git içinde sakladım, böylece o kısım kapsanacak. Şunu duymak isterim: Veri sürüm kontrolü için araçlar. Aşamaları ...

4
Yapay sinir ağları: hangi maliyet fonksiyonu kullanılacak?
TensorFlow'u özellikle sinir ağları ile yapılan deneyler için kullanıyorum . Her ne kadar bazı deneyler yapmama rağmen (XOR-Problem, MNIST, bazı Regresyon işleri, ...) şimdi, belirli problemler için "doğru" maliyet fonksiyonunu seçmekle uğraşıyorum, çünkü genel olarak bir başlangıç ​​olarak kabul edilebilirim. TensorFlow'a gelmeden önce, tamamen bağlı bazı MLP'leri ve bazı tekrarlayan ...

7
ValueError: Girdi, NaN, sonsuzluk veya dtype için çok büyük bir değer içeriyor ('float32')
RandomForest modelini kullanarak test verilerini tahmin ederken ValueError aldım. Benim kod: clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2) clf.fit(X_fit, y_fit) df_test.fillna(df_test.mean()) X_test = df_test.values y_pred = clf.predict(X_test) Hata: ValueError: Input contains NaN, infinity or a value too large for dtype('float32'). Test veri setinde hatalı değerleri nasıl bulabilirim? Ayrıca, bu kayıtları bırakmak ...

3
Pandalarla Korelasyon Matrisinin Hesaplanması ve Görselleştirilmesi
Birkaç girişi olan bir panda veri çerçevem ​​var ve bazı mağaza türlerinin geliri arasındaki ilişkiyi hesaplamak istiyorum. Gelir verileri, faaliyet alanlarının sınıflandırılması (tiyatro, giyim mağazaları, yiyecek ...) ve diğer veriler bulunan çok sayıda mağaza vardır. Yeni bir veri çerçevesi oluşturmaya ve aynı kategoriye ait tüm mağaza türlerinin geliri olan bir ...

5
Pandalarla analiz için 20GB'lık bir dosya açmak
Şu anda makine öğrenmesi amacıyla panda ve python içeren bir dosya açmaya çalışıyorum, hepsinin DataFrame'de olması benim için ideal. Şimdi dosya 18GB büyüklüğünde ve RAM'im 32 GB'dir ancak sürekli bellek hataları alıyorum. Tecrübelerinden mümkün mü? Eğer bu sorunu çözmenin daha iyi bir yolunu bilmiyorsanız? (kovan tablosu? RAM'imin boyutunu 64'e yükseltir? ...

3
Keras cinsinden çoklu GPU
Keras kütüphanesinde (veya tensorflow) çoklu GPU'larda bölüm eğitimini nasıl programlayabilirsiniz? 8 GPU'lu bir Amazon ec2 örneğinde olduğunuzu ve hepsini daha hızlı eğitmek için kullanmak istediğinizi varsayalım, ancak kodunuz yalnızca tek bir CPU veya GPU için.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.