«beginner» etiketlenmiş sorular

Data Science veya ilgili alt alanlarından herhangi birini kullanmaya başlama ile ilgili sorular için.

3
RNN vs CNN yüksek seviyede
Tekrarlayan Sinir Ağları (RNN) ve çeşitleri ve Konvolüsyonel Sinir Ağları (CNN) ve çeşitleri hakkında düşünüyordum. Bu iki noktanın söylemesi adil olur mu: Bir bileşeni (görüntü gibi) alt bileşenlere (görüntüdeki nesnenin, örneğin görüntüdeki nesnenin anahatları gibi) parçalamak için CNN'leri kullanın. Alt bileşenlerin birleşimini oluşturmak için RNN'leri kullanın (resim yazısı, metin oluşturma, …

8
İnternet şirketleri neden veri bilimci işi için Java / Python'u tercih ediyor?
Python / Java deneyimini isteyen veri bilimcileri için iş tanımında defalarca görüyorum ve R'yi göz ardı ediyorum. Aşağıda linkedin aracılığıyla başvurduğum bir şirketin baş veri bilimcisinden aldığım kişisel bir e-posta adresi. X, İlgilendiğiniz ve bağlantı kurduğunuz için teşekkür ederiz. İyi Analytics Becerileriniz var. Bununla birlikte, tüm veri bilimcilerimiz Java / …

1
Xgboost neden GradientBoostingClassifier'ı sklearn'den çok daha hızlı?
100 sayısal özellikli 50k örneklerin üzerinde bir degrade yükseltme modeli yetiştirmeye çalışıyorum. XGBClassifieriken benim makinede 43 saniye içinde kolları 500 ağaçları, GradientBoostingClassifierkolları sadece 10 ağaç (!) 1 dakika ve 2 saniye :( Ben rahatsız etmedi o saat sürer olarak 500 ağaç büyümeye çalışan. Aynı kullanıyorum learning_rateve max_depthayarları , aşağıya bakınız. …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

2
Mevsimsellikte veya diğer düzenlerde değişen zaman serileri ile nasıl başa çıkılır?
Arka fon Enerji sayacı okumalarının zaman serisi veri kümesi üzerinde çalışıyorum. Serinin uzunluğu metreye göre değişir - bazıları için birkaç yıl, diğerleri sadece birkaç ay, vb. Üzerinde çalıştığım şeylerden biri, bu zaman serilerinin kümelenmesi. İşim şu an için akademik ve aynı zamanda verilerin analizini yaparken, bazı kümelenmeler yapmak konusunda özel …

3
Derin Öğrenme kütüphanelerini kullanarak Metinden anahtar kelime / kelime öbeği çıkarma
Belki de bu çok geniş, ancak bir metin özetleme görevinde derin öğrenmenin nasıl kullanılacağına dair referanslar arıyorum. Standart kelime frekansı yaklaşımlarını ve cümle sıralamasını kullanarak metin özetlemeyi zaten uyguladım, ancak bu görev için derin öğrenme tekniklerini kullanma olasılığını araştırmak istiyorum. Ben de duygu analizi için Convolutional Nöral Ağlar (CNN) kullanarak …

3
Veri bilimini nasıl öğrenirim? [kapalı]
Kapalı . Bu sorunun daha fazla odaklanması gerekiyor . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu, yalnızca bu yayını düzenleyerek tek bir soruna odaklanacak şekilde güncelleyin . 4 yıl önce kapalı . Kendi kendini yetiştirmiş bir web geliştiricisiyim ve kendime veri bilimi öğretmekle ilgileniyorum, ancak nasıl …



7
Programcıyım, Veri Bilimi alanına nasıl girebilirim?
Her şeyden önce bu terim çok belirsiz görünüyor. Her neyse .. Ben bir yazılım programcısıyım. Kodlayabildiğim dillerden biri Python. Veri Konuşma SQL kullanabilir ve Veri Kazıma yapabilirim. Veri Bilimi'nin iyi olduğu birçok makaleyi okuduktan sonra şu ana kadar anladım: 1- İstatistikler 2- Cebir 3- Veri Analizi 4- Görselleştirme. 5- Makine …
13 beginner  career 

3
Yapılandırılmamış metin sınıflandırması
Yapılandırılmamış metin belgelerini, yani bilinmeyen yapıdaki web sitelerini sınıflandıracağım. Sınıflandırdığım sınıfların sayısı sınırlıdır (bu noktada üçten fazla olmadığına inanıyorum). Nasıl başlayabileceğim konusunda bir önerisi olan var mı? Burada "kelime torbası" yaklaşımı uygulanabilir mi? Daha sonra, belge yapısına (belki de karar ağaçları) dayalı başka bir sınıflandırma aşaması ekleyebilirim. Mahout ve Hadoop'a …

4
Büyük veri kümelerini anlamak için hangi başlangıç ​​adımlarını kullanmalıyım ve hangi araçları kullanmalıyım?
Dikkat: Makine öğrenimi söz konusu olduğunda tam bir acemiyim ama öğrenmeye hevesliyim. Büyük bir veri setim var ve içinde desen bulmaya çalışıyorum. Veriler arasında, bilinen değişkenlerle veya verilerde yer alan ancak henüz fark etmediğim değişkenlerle gerçekte değişkenler / ilgili olan korelasyon olabilir / olmayabilir. Bunun veri analizi dünyasında tanıdık bir …

1
R kullanarak karar ağaçları oluştururken verileri normalleştirmek zorunda mısınız?
Yani, bu haftaki veri setimizde 14 özellik var ve her sütun çok farklı değerlere sahip. Bir sütun 1'in altında değerlere sahipken, başka bir sütun üç ila dört tam basamaktan oluşan değerlere sahiptir. Geçen hafta normalizasyonu öğrendik ve çok farklı değerlere sahip olduklarında verileri normalleştirmeniz gerekiyor gibi görünüyor. Karar ağaçları için …
10 r  beginner 
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.