«python» etiketlenmiş sorular

Python programlama dili ile ilgili veri bilimi soruları için kullanın. Genel kodlama soruları (-> yığın akışı) için tasarlanmamıştır.


1
Xgboost neden GradientBoostingClassifier'ı sklearn'den çok daha hızlı?
100 sayısal özellikli 50k örneklerin üzerinde bir degrade yükseltme modeli yetiştirmeye çalışıyorum. XGBClassifieriken benim makinede 43 saniye içinde kolları 500 ağaçları, GradientBoostingClassifierkolları sadece 10 ağaç (!) 1 dakika ve 2 saniye :( Ben rahatsız etmedi o saat sürer olarak 500 ağaç büyümeye çalışan. Aynı kullanıyorum learning_rateve max_depthayarları , aşağıya bakınız. …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
Hypertuning XGBoost parametreleri
XGBoost, hem kategorik hem de sürekli bağımlı değişkenlerle uğraşmak konusunda mükemmel bir iş çıkarıyor. Ancak, bir XGBoost problemi için optimize edilmiş parametreleri nasıl seçerim? Son Kaggle problemi için parametreleri şöyle uyguladım: param <- list( objective = "reg:linear", booster = "gbtree", eta = 0.02, # 0.06, #0.01, max_depth = 10, #changed …
27 r  python  xgboost 

3
Lineer regresyonda ağırlıkları negatif olmaya zorlama
Python'da scikit-learn kullanarak standart bir doğrusal regresyon kullanıyorum. Bununla birlikte, ağırlıkları her özellik için negatif (negatif değil) tümüyle pozitif olmaya zorlamak istiyorum, bunu başarabilmemin bir yolu var mı? Belgelere bakıyordum ama bunu başarmanın bir yolunu bulamadım. Anladığım kadarıyla en iyi çözümü alamayabilirim, ancak ağırlıkların negatif olmamasına ihtiyacım var.

1
PyTorch vs. Tensorflow Fold
Hem PyTorch hem Tensorflow Fold , girdi verilerinin tek tip uzunluk veya boyutlara sahip olmadığı durumlarla (yani dinamik grafiklerin yararlı veya gerekli olduğu durumlar) başa çıkacak derin öğrenme çerçeveleridir. Nasıl dayandıklarını, dayandıkları paradigmalar (örneğin, dinamik gruplama) ve bunların anlamları, her birinde uygulanamayan / uygulanamayan şeyler, zayıflıklar / güçler vb. Dinamik …

7
Python çalışma ortamı başka bir makineye nasıl kopyalanır?
İş istasyonumda Python (Anaconda + Flask) ile bir makine öğrenme modeli geliştirdim ve her şey yolunda gitti. Daha sonra, bu programı elbette aynı ortamı kurmaya çalıştığım başka bir makineye göndermeye çalıştım, ancak program çalışmadı. Programı sorunsuzca çalıştığı diğer makinelere de kopyaladım. Sorunun arızalı durumda ne olduğunu çözemiyorum (hem program kodu …
26 python  anaconda 

6
Sevdikleri Facebook sitelerine dayanarak kullanıcıların yaşını tahmin etmek için makine öğrenme teknikleri
Facebook uygulamamdan bir veritabanım var ve hangi Facebook sitelerini beğendiklerini temel alarak kullanıcıların yaşlarını tahmin etmek için makine öğrenmeyi kullanmaya çalışıyorum. Veritabanımın üç önemli özelliği var: Eğitim setimdeki yaş dağılımı (toplamda 12 bin kullanıcı) daha genç kullanıcılara çarpıyor (yani 27 yaşımda 1157, 65 yaşımda 23 kullanıcı var); birçok sitenin 5'den …


4
Pandas.DataFrame.isin'i paralel olarak çalıştırmanın basit bir yolu var mı?
DataFrame.isinBirkaç bin belirli sayfanın her biri için bireysel kullanıcıların kayıtlarını "beğenen" facebook listelerinde arama yaparak, pandaların işlevini yoğun kullanan bir modelleme ve puanlama programım var . Bu, programlamanın en zaman alan kısmı, modelleme veya puanlama parçalarından çok, sadece geri kalanı eşzamanlı olarak birkaç düzine çalıştırırken sadece bir çekirdekte çalıştığı için. …

4
Adlandırılmış Varlık Tanıma için Word2Vec
Adlandırılmış bir varlık tanıma sistemi oluşturmak için google’ın word2vec uygulamasını kullanmak istiyorum. Yapısal geri yayılımlı özyinelemeli sinir ağlarının adlandırılmış varlık tanıma görevleri için uygun olduğunu duydum, ancak bu tür bir model için iyi bir uygulama ya da iyi bir eğitim bulamadım. Atipik bir korpusla çalışıyorum, NLTK ve benzeri standart NER …

5
Veri bilimi projeleri için VM görüntüsü
Veri bilimi görevleri için çok sayıda araç bulunduğundan ve her şeyi kurmak ve mükemmel bir sistem oluşturmak zordur. İnsanların hemen kullanabileceği Python, R ve diğer açık kaynaklı veri bilim araçlarının kurulu olduğu bir Linux / Mac OS görüntüsü var mı? Bir Ubuntu veya en son Python, R (IDE'ler dahil) ve …
24 python  r  tools 

4
Scikit-learn: Lojistik Regresyonun yanı sıra tahmin etmek için SGDClassifier'ı edinmek
Lojistik Regresyon'u eğitmenin bir yolu, scikit-learn'ın bir arayüz sunduğu stokastik degrade inişini kullanmaktır. Yapmak istediğim bir scikit- learn'ın SGDClassifier'ı almak ve burada Lojistik Regresyon ile aynı puanı almak . Ancak puanlarım eşit olmadığından bazı makine öğrenme geliştirmelerini kaçırmam gerekiyor. Bu benim şu anki kodum. Lojistik Regresyon ile aynı sonuçları vermesini …

3
Python makine öğrenme modellerini saklamak için en iyi yöntemler
Makine öğrenimi modellerini kaydetmek, saklamak ve paylaşmak için en iyi uygulamalar nelerdir? Python'da genel olarak turşu veya joblib kullanarak modelin ikili gösterimini saklıyoruz. Modeller, benim durumumda, ~ 100Mo büyük olabilir. Ayrıca, joblib ayarlanmadıkça bir modeli birden fazla dosyaya kaydedebilir compress=1( /programming/33497314/sklearn-dumping-model-using-joblib-dumps-multiple-files-which-one-is-the- kore ). Ancak, modellere erişim haklarını kontrol etmek ve …

4
Kümelemeden önce verilerinizi standartlaştırmak gerekli midir?
Kümeden önce verilerinizi standart hale getirmek gerekli midir? Dan örnekte scikit learnDBSCAN hakkında, burada onlar doğrultusunda bunu: X = StandardScaler().fit_transform(X) Ama neden gerekli olduğunu anlamıyorum. Sonuçta, kümeleme herhangi bir veri dağılımını varsaymaz - denetimsiz bir öğrenme yöntemidir, bu nedenle amacı verileri araştırmaktır. Verileri dönüştürmek neden gerekli olsun?

5
Python'da KL Ayrışmasının Hesaplanması
Bunun için yeniyim ve bunun arkasındaki teorik kavramları tam olarak anladığımı söyleyemem. Python'daki birkaç nokta listesi arasındaki KL Diverjansını hesaplamaya çalışıyorum. Bunu denemek ve yapmak için http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html adresini kullanıyorum . Karşılaştığım sorun, döndürülen değerin 2 sayı listesi için aynı olması (bunun 1.3862943611198906). Burada bir çeşit teorik hata yapıyorum ama farkedemiyorum. …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.