Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

5
Makine Öğrenimi için başlangıç ​​matematik kitapları
İstatistik veya ileri matematik bilgisi olmayan bir Bilgisayar Bilimleri mühendisiyim. Raschka ve Mirjalili'nin Python Machine Learning kitabını inceliyorum, ancak Machine Learning'in matematiğini anlamaya çalıştığımda, bir arkadaşımın bana İstatistiksel Öğrenmenin Unsurlarını önerdiği harika kitabı anlayamadım . Makine Öğrenimi için daha kolay istatistik ve matematik kitapları biliyor musunuz? Eğer yapmazsan nasıl hareket …

1
Çoklu zaman serileri kullanan RNN
Zaman serilerini girdi olarak kullanarak nöral bir ağ oluşturmaya çalışıyorum, her serinin türüne göre eğitmek için. RNN'leri kullanarak girdiyi toplu olarak bölebileceğinizi ve zaman serisinin her noktasını bireysel nöronlara kullanabileceğinizi ve sonunda ağı eğitebileceğinizi okudum. Ne yapmaya çalışıyorum ama bir girdi olarak birden çok zaman serisi kullanmaktır. Örneğin, iki sensörden …
14 time-series  rnn 

1
Rastgele Ormanları kullanarak örnekleme yapmak için kaç özellik
Vikipedi sayfası tırnak "İstatistiksel Öğrenme Unsurları" diyor: Genellikle, özelliklerine ilişkin bir sınıflandırma sorunu için her özellikleri kullanılır.ppp⌊p–√⌋⌊p⌋\lfloor \sqrt{p}\rfloor Bunun oldukça iyi eğitimli bir tahmin olduğunu ve muhtemelen ampirik kanıtlarla doğrulandığını anlıyorum, ancak birinin kare kökü seçmesinin başka nedenleri var mı? Orada meydana gelen istatistiksel bir olay var mı? Bu bir …

1
Naive Bayes Sınıflandırıcısı hesaplamasında sıfır faktörü nasıl ele alınır?
Bir eğitim veri setim varsa ve üzerinde bir Naive Bayes Sınıflandırıcısı eğitirsem ve olasılık sıfır olan bir özellik değerine sahipsem. Daha sonra yeni verilerdeki sınıflandırmayı tahmin etmek istersem bunu nasıl halledebilirim? Sorun şu ki, hesaplamada sıfır varsa, başka bir çözüm bulabilecek başka ne kadar değer aldığım önemli değil, tüm ürün …

5
Modern R ve / veya Python kütüphaneleri SQL'i geçersiz kılıyor mu?
SQL Server'ın veri işlemeden temizlemeye ve munging'e kadar yaptığımız her şeyin belkemiği olduğu bir ofiste çalışıyorum. İş arkadaşım, gelen verileri yöntemsel olarak işlemek için karmaşık işlevler ve saklı yordamlar yazma konusunda uzmanlaşmıştır, böylece standartlaştırılabilir ve raporlarda, görselleştirmelerde ve analiz projelerinde çalıştırılabilir. Buraya başlamadan önce, en temel sorguları yazmanın yanı sıra …
14 python  r  data-cleaning  data  sql 

1
Python haritasında ısı haritası
Mode Analytics'in hoş bir ısı haritası özelliği vardır ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Ancak haritaları karşılaştırmak için elverişli değildir (rapor başına yalnızca bir tane). İzin verdikleri, verilerin kolayca sarılmış bir python dizüstü bilgisayarına çekilmesidir. Ve sonra python'daki herhangi bir görüntü bir rapora kolayca eklenebilir. Benim sorum şu: Python'daki gerçek bir harita üzerinde …

1
Maksimum havuzlama katmanları aracılığıyla geri yayılım
Bu soruya küçük bir alt sorum var . Maksimum havuzlama katmanı boyunca geri yayılırken, gradyanın, max olarak seçilen bir önceki katmandaki nöronun tüm gradyanı alacağı şekilde geri yönlendirildiğini anlıyorum. % 100 emin olmadığım bir sonraki katmandaki degrade havuz katmanına nasıl yönlendirilir. İlk soru, aşağıdaki görüntü gibi, tamamen bağlı bir katmana …

3
Doc2vec (gensim) - Görünmeyen cümlelerin etiketini nasıl çıkarabilirim?
https://radimrehurek.com/gensim/models/doc2vec.html Örneğin, doc2vec ile "aaaaaAAAAAaaaaaa" - "etiket 1" "BbbbbbBBBBBbbbb" - "etiket 2" "aaaaAAAAaaaaAA" ​​etiketini Doc2vec kullanarak 1 olarak belirleyebilir miyiz? Doc2vec'in kelime vektörlerini ve etiket vektörlerini eğitebileceğini biliyorum. Bu vektörleri kullanarak, hangi etikette görünmeyen cümleler (eğitilmiş kelimelerin kombinasyonu) çıkarabiliriz?
14 gensim 

1
(Dinamik) Bayes ağı ile HMM arasındaki fark nedir?
HMM'lerin, Partikül Filtrelerinin ve Kalman filtrelerinin dinamik Bayes ağlarının özel durumları olduğunu okudum. Ancak, sadece HMM'leri biliyorum ve dinamik Bayes ağları arasındaki farkı görmüyorum. Birisi açıklayabilir mi lütfen? Cevabınız aşağıdakine benzer olabilir, ancak bayes Ağları için iyi olurdu: Gizli Markov Modelleri Bir Gizli Markov Modeli (HMM) 5 parçalı bir :λ=(S,O,A,B,Π)λ=(S,O,A,B,Π)\lambda …

3
Dengesiz sınıfta, doğrulama / test veri kümelerimde örnekleme altında kullanmak zorunda mıyım?
Makine öğrenimine yeni başlıyorum ve bir durumla karşı karşıyayım. IPinYou veri kümesi ile bir Gerçek Zamanlı Teklif sorunu üzerinde çalışıyorum ve bir tıklama tahmini yapmaya çalışıyorum. Mesele şu ki, bildiğiniz gibi, veri kümesi çok dengesiz: 1 olumlu örnek (tıklama) için yaklaşık 1300 negatif örnek (tıklama yok). Bu benim işim: Verileri …

2
Yüksek boyutlu veriler: Bilinmesi gereken faydalı teknikler nelerdir?
Çeşitli boyutsallık küfürleri nedeniyle , yaygın öngörücü tekniklerin çoğunun doğruluğu ve hızı yüksek boyutlu verilerde bozulmaktadır. Yüksek boyutlu verilerle etkili bir şekilde başa çıkmaya yardımcı olan en kullanışlı teknikler / püf noktaları / buluşsal yöntemler nelerdir? Örneğin, Bazı istatistiksel / modelleme yöntemleri yüksek boyutlu veri kümelerinde iyi performans gösteriyor mu? …

2
Normal olarak dağıtılmayan A / B test sonuçlarının bağımsız t testi kullanılarak analiz edilmesi
Normal dağılım uymayan bir A / B testi (bir kontrol grubu, bir özellik grubu) sonuçları bir dizi var. Aslında dağıtım Landau Dağıtımına daha çok benzemektedir. Bağımsız t-testinin örneklerin en azından yaklaşık olarak normal olarak dağıtılmasını gerektirdiğine inanıyorum. Ama sorum şu: t-testinin anlamlılık testi için iyi bir yöntem olmadığını hangi noktada …


3
CNN için görüntü yeniden boyutlandırma ve dolgu
Görüntü tanıma için bir CNN eğitmek istiyorum. Eğitim için resimlerin boyutu sabit değil. Örneğin CNN için giriş boyutunun 50x100 (yükseklik x genişlik) olmasını istiyorum. Bazı küçük boyutlu görüntüleri (örneğin 32x32) giriş boyutuna yeniden boyutlandırdığımda, görüntünün içeriği yatay olarak çok fazla uzatılıyor, ancak bazı orta boyutlu görüntüler için iyi görünüyor. İçeriğin …

1
Karar ağaçları: yaprak bilge (en iyisi ilk) ve seviye bilge ağacı geçişi
Sorun 1: Ağacın genişleme şekliyle ilgili LightGBM tanımıyla kafam karıştı . Belirtiyorlar: Karar ağacı öğrenme algoritmalarının çoğu, aşağıdaki görüntüde olduğu gibi, seviye (derinlik) yönde büyür: Sorular 1 : Hangi "en" algoritmalar bu şekilde uygulanır? Bildiğim kadarıyla C4.5 ve CART DFS kullanıyor. XGBoost BFS kullanır. Hangi diğer algoritmalar veya paketler karar …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.