«pandas» etiketlenmiş sorular

pandalar Panel Verileri manipülasyonu ve analizi için bir python kütüphanesidir, örneğin istatistiklerde, deneysel bilim sonuçlarında, ekonometri veya finansta yaygın olarak bulunan çok boyutlu zaman serileri ve kesitsel veri setleri.

2
Eksik verilerle iş akışının neresinde ilgilenmeliyiz?
Çok büyük bir veritabanından (burada, SQL ve Vertica aracılığıyla Vertica) alınan verilerden makine öğrenme modelleri (benim durumumda, Python pandasve sklearnpaketleri kullanarak) oluşturmak için bir iş akışı oluşturuyorum pyodbcve bu süreçte kritik bir adım eksik öngörücülerin değerleri. Bu, tek bir analiz veya istatistik platformu içinde basittir - Python, R, Stata, vb. …

3
Pandalar Veri Çerçevesi - DMatrix
Scikit öğrenmek xgboost çalıştırmak çalışıyorum. Ve ben sadece veri çerçevesine veri yüklemek için Pandalar kullanın. Nasıl xgboost ile pandalar df kullanmak gerekiyordu. Ben xgboost algo çalıştırmak için gerekli DMatrix rutin karıştı.

1
İnt panda sütununu zaman damgası veri tipine dönüştürme
Diğer şeylerin yanı sıra, 1970-1-1'den bu yana geçen milisaniye sayısı bir sütun içeren bir veri çerçevesi var. Tamamen 1970-1-1 için datetime değerleri içeren bir dizi zaman damgası sütun serisi ekleyerek daha sonra nihayet datetime veri sütununa dönüştürmek için ints bu sütun veri dönüştürmek gerekir. Dizeleri bir dizi datetime veri (pandas.to_datetime) …

5
Panda veri çerçevesinin düzenli ilişkisel veritabanına avantajları
Veri Biliminde, birçok kişi veri deposu olarak panda veri çerçevelerini kullanıyor gibi görünüyor . Diğer programlama alanlarında veri depolamak için kullanılan MySQL gibi düzenli ilişkisel veritabanlarına kıyasla onu üstün bir veri deposu yapan pandaların özellikleri nelerdir ? Pandalar veri keşfi için bazı yararlı işlevler sunarken, SQL'i kullanamazsınız ve sorgu optimizasyonu …
13 pandas  databases 

3
Pandalar'daki toplu sütunları toplu dönüştürme (tek etkin kodlama değil)
Scikit-learn ile karar ağacında kullanmayı planladığım tonlarca kategorik sütun içeren panda veri çerçevem ​​var. Onları sayısal değerlere dönüştürmem gerekiyor (bir sıcak vektör değil). Scikit-learn'dan LabelEncoder ile yapabilirim. Sorun çok fazla olması ve bunları manuel olarak dönüştürmek istemiyorum. Bu süreci otomatikleştirmenin kolay bir yolu ne olurdu.

1
Kaç LSTM hücresi kullanmalıyım?
Kullanmam gereken minimum, maksimum ve "makul" miktarda LSTM hücresi ile ilgili herhangi bir temel kural (veya gerçek kurallar) var mı? Özellikle ben ilişkin am BasicLSTMCell TensorFlow ve gelen num_unitsmülk. Lütfen şu şekilde tanımlanan bir sınıflandırma sorunum olduğunu varsayalım: t - number of time steps n - length of input vector …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

2
Python Pandalarda iki veri çerçevesini nasıl birleştiririm?
İki veri çerçevesi df1 ve df2 var ve bunları tek bir veri çerçevesinde birleştirmek istiyorum. Sanki df1 ve df2, tek bir veri çerçevesini merkezden dikey olarak bölerek yaratılmış gibi, sütunların yarısının bir kağıda geçmesi ve sütunların yarısının diğerine geçmesi için bir liste içeren bir kağıdın ikiye bölünmesi gibi. Onları bir …
12 pandas 

3
Python için kullanıma hazır iyi dil modelleri var mı?
Ben bir uygulama prototip ve bazı oluşturulan cümleler üzerinde şaşkınlık hesaplamak için bir dil modeline ihtiyacım var. Python'da kolayca kullanabileceğim eğitimli bir dil modeli var mı? Gibi basit bir şey model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 …
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

3
Bilimsel hesaplama için en iyi diller [kapalı]
Kapalı . Bu sorunun daha fazla odaklanması gerekiyor . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu, yalnızca bu yayını düzenleyerek tek bir soruna odaklanacak şekilde güncelleyin . 5 yıl önce kapalı . Çoğu dilde bazı bilimsel bilgi işlem kütüphaneleri var gibi görünüyor. Python var Scipy Rust …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 



3
Python'da aynı değerleri nasıl gruplayabilir ve frekanslarını nasıl sayabilirim?
Python ile analitik yeni başlayanlar bu yüzden lütfen nazik olun :-) Bu sorunun cevabını bulamadım - başka bir yerde farklı bir formatta zaten cevaplandıysa özür dilerim. Bir perakende satış mağazası için işlem verileri veri kümem var. Açıklama ile birlikte değişkenler: bölüm: mağazanın bölümü, bir str; prod_name: ürünün adı, str; makbuz: …

3
Çevresel verilere dayalı mahsul verimlerini tahmin etmek için bir makine öğrenme modeli oluşturmak
10 yıldır (2005 - 2014) bir çiftlik için sıcaklık, yağış ve soya fasulyesi verimi hakkında veri içeren bir veri setim var. Bu verilere dayanarak 2015 yılı getirilerini tahmin etmek istiyorum. Veri kümesinin sıcaklık ve yağış için GÜNLÜK değerlere sahip olduğunu, ancak verim için yılda sadece 1 değere sahip olduğunu unutmayın, …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.