Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap


2
Kullanıcının Amazon'daki satın alma davranışını nasıl modelleyebilirim?
Veri Bilimi alanındaki son kurs projemiz için şunları önerdik: Amazon Reviews Veri Kümesi'ni verin, Amazon'a reklam yerleştirmek için stratejik bir konum belirleyen bir algoritma (kabaca Kişiselleştirilmiş PageRank tabanlı) bulmayı planlıyoruz. Örneğin, Amazon'da milyonlarca ürün var. Ve veri seti size hangi ürünlerin ilişkili olduğu, hangi ürünlerin bir araya getirildiği, bir araya …

3
Duygu Analizi Eğitimi
Duygu analizi ve herhangi bir dil (R, Python vb.) Kullanarak nasıl uygulanacağını anlamaya çalışıyorum. İnternet üzerinden takip edebileceğim iyi bir yer olup olmadığını bilmek istiyorum. Google'ı aradım, ama çok memnun değildim çünkü öğreticiler değil, daha fazla teoriydi. Teori ve pratik örnekler istiyorum.

2
Vektör dizilerinin sınıflandırılması
Veri setim vektör dizilerinden oluşuyor. Her vektörün 50 gerçek değerli boyutu vardır. Bir sekanstaki vektörlerin sayısı 3-5 ila 10-15 arasındadır. Başka bir deyişle, bir dizinin uzunluğu sabit değildir. Bazı adil sekanslar (vektörler değil!) Bir sınıf etiketi ile açıklanır. Benim görevim, bir dizi vektör verilen bir sınıflandırıcıyı öğrenmek, tüm dizi için …



1
Destek Vektör Makineleri için özellik seçimi
Sorum üç kat "Çekirdekleştirilmiş" destek vektör makineleri bağlamında Değişken / özellik seçimi istenir mi - özellikle aşırı sığmayı önlemek için C parametresini düzenli hale getirdiğimizden ve çekirdekleri bir SVM'ye sokmanın arkasındaki ana sebep sorunun boyutsallığını arttırmak olduğu için, bu durumda boyutları parametre küçültme ile azaltmak karşı sezgisel görünüyor İlk sorunun …

2
Python'da Tamamlayıcı Naif Bayes mi uygulanıyor?
Sorun Suç verileri etiketli bir veri kümesi üzerinde Naive bayes kullanmayı denedim ama gerçekten kötü sonuçlar (% 7 doğruluk) var. Naive Bayes kullandığım diğer alogoritmalardan çok daha hızlı çalışıyor, bu yüzden skorun neden bu kadar düşük olduğunu bulmak istedim. Araştırma Okuduktan sonra daha yüksek frekanslı sınıflar için bir önyargıya sahip …

2
Boyutsal azalmanın tersine bir yöntem var mı?
Makine öğrenimi alanında yeniyim ancak sinyal işleme konusunda payımı aldım. Bu sorunun yanlış etiketlenmiş olup olmadığını lütfen bize bildirin. En az üç değişkenle tanımlanan iki boyutlu verilerim var, oldukça doğrusal olmayan model benzetmek için çok karmaşık. PCA ve ICA (python kütüphanesi Scikit-Learn) gibi yöntemleri kullanarak verilerden iki ana bileşeni ayıklamada …


1
NER için Vowpal Wabbit kullanma
Vowpal Wabbit (VW) görünüşe göre SEARN aracılığıyla dizi etiketleme işlevselliğini desteklemektedir . Sorun, açıklamaları ve bazı örnekleri ile ayrıntılı bir parametre listesi hiçbir yerde bulamıyor olmasıdır. Bulabildiğim en iyi şey, çok kısa bir örnekle Zinkov'un blog girişi . Ana wiki sayfası zorlukla SEARN bahseder. Teslim alınan kaynak kodunda bazı NER …

1
Zaman sıralı veriler için gözetimsiz öğrenme algoritmaları var mı?
Verilerimdeki her gözlem 0,1 saniye farkla toplandı. Buna zaman dizisi demiyorum çünkü tarih ve zaman damgası yok. Kümeleme algoritmaları (çevrimiçi buldum) ve PCA örneklerinde, örnek veriler vaka başına 1 gözlem içerir ve zamanlanmaz. Ancak verilerim araç başına her 0.1 saniyede bir toplanan yüzlerce gözlem içeriyor ve birçok araç var. Not: …

3
Amazon ec2'de R rastgele orman Hatası: 5,4 Gb boyutunda vektör tahsis edilemiyor
R'de randomForest()1000 ağaç ve yaklaşık 20 öngörücü ve 600K sıralı veri çerçeveleri kullanarak rastgele orman modelleri eğitimi alıyorum . Dizüstü bilgisayarımda her şey iyi çalışıyor, ama aynı şeyi çalıştırmak için amazon ec2'ye taşındığımda hatayı alıyorum: Error: cannot allocate vector of size 5.4 Gb Execution halted c3.4xlargeÖrnek türü kullanıyorum, bu yüzden …

2
Gizli Dirichlet Tahsisinden elde edilen konuları kullanarak belgelerin kümelenmesi
Latent Dirichlet Tahsisini bir proje için kullanmak istiyorum ve Python'u gensim kütüphanesi ile kullanıyorum. Konuları bulduktan sonra, belgeleri k-means gibi bir algoritma kullanarak kümelemek istiyorum (İdeal olarak üst üste binen kümeler için iyi bir tane kullanmak istiyorum, böylece herhangi bir öneri memnuniyetle karşılanmaktadır). Konuları almayı başardım ama bunlar şu şekildedir: …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.