Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

7
Büyük Veri Analitiğine kariyer geçişi
Ben tamamen teknik olan 35 yaşında bir BT uzmanıyım. Programlama, yeni teknolojileri öğrenme, anlama ve uygulama konusunda iyiyim. Okulda matematiği sevmedim, bu yüzden matematikte iyi puan almadım. Büyük Veri analitiğinde kariyer yapmakla çok ilgileniyorum. Büyük Veri teknolojilerinden (Hadoop vb.) Ziyade Analytics'le ilgileniyorum, ancak beğenmiyorum. Ancak, internette etrafıma baktığımda, analitikte iyi …
9 career 

1
Sinyal kodlamayı öğrenme
Manchester şifreli bit akışlarını ses sinyalleri olarak temsil eden çok sayıda örneğim var. Kodlanma sıklıkları, yüksek olduğunda birincil frekans bileşenidir ve arka planda sabit miktarda beyaz gürültü vardır. Bu akışları manuel olarak çözdüm, ancak kodlama şemalarını öğrenmek için bir tür makine öğrenme tekniği kullanıp kullanamayacağımı merak ediyordum. Bu, bu şemaları …

4
Metin sınıflandırıcı eğitim veri kümeleri önerin
Bir metin sınıflandırıcısını eğitmek için hangi serbestçe kullanılabilen veri kümelerini kullanabilirim? Onun için en alakalı içeriği önererek kullanıcılarımızın katılımını artırmaya çalışıyoruz, bu yüzden içeriğimizi önceden tanımlanmış bir kelime torbasına göre sınıflandırırsak, önceden sınıflandırılmış rastgele sayıda gönderi hakkında geri bildirim alarak içeriğine ilgi çekici bir şekilde geri dönmesini önerebiliriz. önce. Bu …

1
ILP'siz İlişkisel Veri Madenciliği
Ben bir sınıflandırma modeli oluşturmak için gereken ilişkisel bir veritabanından büyük bir veri kümesi var. Normalde bu durum için İndüktif Mantık Programlama (ILP) kullanırım, ancak özel durumlar nedeniyle bunu yapamam. Bunun üstesinden gelmenin diğer bir yolu da sadece yabancı bir ilişkim olduğunda değerleri toplamaya çalışmak olacaktır. Bununla birlikte, bazı nominal …

2
Akıllı telefon veri kümesi problemini kullanarak insan etkinliği tanıma
Bu toplulukta yeniyim ve umarım sorum buraya tam olarak uyacaktır. Lisans veri analizi kursumun bir parçası olarak, akıllı telefon veri setlerini kullanarak insan etkinliği tanıma projesini yapmayı seçtim. Endişe duyduğum kadarıyla bu konu Makine Öğrenimi ve Destek Vektör Makineleri ile ilgilidir. Bu teknolojilere henüz aşina değilim, bu yüzden yardıma ihtiyacım …

1
SMOTE tekniğini kullanarak veri kümesini dengelemede kullanılan en iyi performans metriği nedir?
Veri setimi fazla örneklemek için smote tekniği kullandım ve şimdi dengeli bir veri setim var. Karşılaştığım sorun performans metrikleri; dengesiz veri kümesinde hassasiyet, hatırlama, f1 ölçümü, doğruluk, dengeli veri kümesinden daha iyi performans gösterir. Dengeleme veri kümesinin modelin performansını artırabileceğini göstermek için hangi ölçümü kullanabilirim? Not: Dengeli veri kümesinde, dengesiz …

1
keras'ın ModelCheckpoint'i çalışmıyor
Keras'da bir model eğitmeye çalışıyorum ve ModelCheckpoint'i izlenen bir doğrulama metriğine (benim durumumda Jaccard indeksi ) göre kaydetmek için kullanıyorum . Modelin tensorboard'da iyileştiğini görsem de, ağırlıkları yüklemeye ve hiç çalışmadığı modeli değerlendirmeye çalıştığımda. Ayrıca, ağırlıkların saklanması gereken dosyadaki zaman damgası ile bunların kaydedilmediğini söyleyebilirim. Zaman damgası kabaca eğitime başladığım …
8 keras  convnet 

1
Dengesiz sınıflarla başa çıkma yaklaşımlarının sınıflandırılması
Dengesizlik sınıf problemiyle başa çıkmak için geliştirilen yaklaşımları sınıflandırmanın en iyi yolu nedir? Bu makale onları şu kategorilere ayırır: Önişleme: aşırı örnekleme, düşük örnekleme ve hibrit yöntemleri içerir, Maliyete duyarlı öğrenme: İkincisinin eşikleme ve örneklemeye daha da bölündüğü doğrudan yöntemleri ve meta öğrenmeyi içerir, Topluluk teknikleri: maliyete duyarlı toplulukları ve …



5
Konu modelleri ve LDA ile ilgili öğreticiler
Konu modelleri ve LDA hakkında bazı iyi öğreticiler (hızlı ve anlaşılır) olup olmadığını, bazı parametrelerin nasıl ayarlanacağını, ne anlama geldiğini ve mümkünse bazı gerçek örneklerle sezgisel olarak öğretip öğretmediğinizi bilmek istiyorum.

2
Gradient Boosting regresyonu, egzersiz setimde negatif y değeri olmadığında neden negatif değerleri öngörüyor?
I ağaçların sayısını artırmak gibi scikit öğrenmek 's GradientBoostingRegressor, ben hiçbir negatif değerler benim eğitim veya set test bulunmasına rağmen, daha olumsuz tahminler alabilirsiniz. Çoğu ikili olan yaklaşık 10 özelliğim var. Ayarladığım parametrelerden bazıları: ağaç / yineleme sayısı; öğrenme derinliği; ve öğrenme oranı. Negatif değerlerin yüzdesi ~% 2'de maks. 1 …

2
CNN modelinde daha fazla katman kullanılırken bellek hatası
Dell Core i7 - 16GB RAM - 4GB 960m GPU dizüstü bilgisayarımda, 3B CNN kullanarak akciğer CT görüntülerini sınıflandırmak için bir proje üzerinde çalışıyorum. Tensorflow'un CPU sürümünü kullanıyorum. Görüntüler numpy dizi boyutu (25,50,50) olarak hazırlanır. CNN modelimde 2 dönüşümlü katman, iki maxpool katman, bir FC katmanı ve çıktı katmanı vardı. …


1
Önyargı-varyans dengesi ve optimizasyon yöntemleri hakkında soru
Bu yüzden, örneğin, yüksek önyargı veya yüksek sapma ile ortaya çıkan sorunlarla karşı karşıya kaldığında oluşturmaya çalıştıkları modeli en iyi şekilde nasıl optimize edebileceğini merak ediyordum. Şimdi, elbette, tatmin edici bir sona ulaşmak için normalleştirme parametresi ile oynayabilirsiniz, ancak bunu normalleşmeye güvenmeden yapmanın mümkün olup olmadığını merak ediyordum. Eğer b …
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.