Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

3
Karmaşık bir Radar Grafiğini nasıl oluştururum?
Yani, Oyuncu Profili Radar Tablosu şöyle bir şey oluşturmak istiyorum: Sadece her değişkenin ölçeği farklı değil, aynı zamanda daha az aslında iyi anlamına gelen 'mülksüzleştirilmiş' stat gibi bazı istatistikler için tersine çevrilmiş bir ölçek istiyorum. Her istatistik için değişken ölçek için bir çözüm belki bir kıyaslama belirlemek ve daha sonra …

3
İlk anahtar kelimelere dayalı olarak alakalı kelimelerin listesi nasıl büyütülür?
Kısa bir süre önce Google E-Tablolar'da sunulan harika bir özellik gördüm : ardışık hücrelere birkaç alakalı anahtar kelime yazarak başlayın, "mavi", "yeşil", "sarı" deyin ve otomatik olarak benzer anahtar kelimeler (bu durumda) oluşturur , diğer renkler). Bu YouTube videosunda daha fazla örneğe bakın . Bunu kendi programımda çoğaltmak istiyorum. Freebase'i …

4
Tek bir olayın boyuna verileri etkileme olasılığını analiz etmek için hangi istatistiksel modeli kullanmalıyım?
Belirli bir olayın bazı boyuna verileri etkileme olasılığını analiz etmek için kullanılacak bir formül, yöntem veya model bulmaya çalışıyorum. Google'da ne arayacağımı bulmakta zorlanıyorum. Örnek bir senaryo: Her gün ortalama 100 gömme müşteriye sahip bir işletmenizin olduğunu görün. Bir gün, mağazanıza her gün gelen müşteri sayısını artırmak istediğinize karar verirsiniz, …

3
Lojistik regresyonda maliyet fonksiyonunun Python uygulaması: neden bir ifadede nokta çarpımı ancak başka bir ifadede eleman-bilge çarpımı
Lojistik regresyon ortamında matrislerin Python, numpy ve çarpımı ile ilgili çok temel bir sorum var. İlk olarak, matematik notasyonunu kullanmadığım için özür dilerim. Ben akıllıca pultiplication karşı matris nokta çarpma kullanımı hakkında karıştı. Maliyet fonksiyonu şu şekilde verilir: Ve python'da bunu şöyle yazdım cost = -1/m * np.sum(Y * np.log(A) …

1
Boylam / enlem özelliğiyle başa çıkma yolları [kapalı]
Kapalı . Bu sorunun ayrıntılara veya açıklığa ihtiyacı var . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Bu yayını düzenleyerek ayrıntıları ekleyin ve sorunu giderin . 3 yıl önce kapalı . 25 özellikli kurgusal bir veri kümesi üzerinde çalışıyorum. Özelliklerden ikisi, bir yerin enlem ve boylamıdır ve …

4
“LSTM hücresindeki birim sayısı” nın anlamı nedir?
Gönderen Tensorflow kodu: Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. Bunun ne anlama geldiğini anlayamıyorum. LSTM hücresinin birimleri nelerdir. Giriş, Çıkış ve giriş kapıları? Bu "Derin LSTM için tekrarlayan projeksiyon katmanındaki birim sayısı" anlamına gelir. O zaman buna neden "LSTM hücresindeki birim sayısı" denir? LSTM …

1
NLP - neden bir dur sözcüğü değil?
Konu modelleme yapmadan önce stop kelimeleri kaldırmaya çalışıyorum. Bazı olumsuzlama kelimelerinin (değil, asla, hiçbiri vb.) Genellikle durma kelimeleri olarak kabul edildiğini fark ettim. Örneğin, NLTK, spacy ve sklearn durdurma kelime listelerine "not" ekler. Ancak, aşağıdaki cümlelerden "değil" i kaldırırsak, anlamlı anlamı kaybederler ve bu konu modelleme veya duyarlılık analizi için …

4
Benzerlik puanlarına dayalı kümeleme
Biz elemanları bir dizi olduğunu varsayalım E ve bir benzerlik ( değil mesafe ) işlevi sim (örnek, ej) iki eleman arasında ei, ej ∈ e . Sim kullanarak E öğelerini (verimli bir şekilde) nasıl kümelendirebiliriz ? k , örneğin, belirli bir k gerektirir, Kanopi Kümelemesi iki eşik değeri gerektirir. Bu …


2
Parti boyutunu 2'lik bir güçte tutmanın avantajı nedir?
Makine öğreniminde modelleri eğitirken, bazen parti boyutunu 2'lik bir güçte tutmak neden avantajlıdır? GPU belleğinize / RAM'inize en uygun boyutu kullanmanın en iyisi olacağını düşündüm. Bu cevap , bazı paketler için, 2'lik bir gücün parti boyutu olarak daha iyi olduğunu iddia ediyor. Birisi bunun için ayrıntılı bir açıklama / bağlantı …

3
Resmi Olmayan Metin Üzerinde Adlandırılmış Varlık Tanıma için Veri Kümesi
Şu anda resmi olmayan metinden (tweet'lere benzer bir şey) adlandırılmış varlıkları çıkarmak için bir model eğitmek için etiketli veri kümeleri arıyorum. Büyük / küçük harf ve dilbilgisi veri kümemdeki belgelerde genellikle bulunmadığından, günümüzdeki varlık tanıma sistemleri adı verilen haber makalesi ve dergi kayıtlarından biraz daha "gayriresmi" alan dışı veri arıyorum. …
18 dataset  nlp 

4
Meta verilere sahip metin belgelerine nasıl açıklama eklenir?
Çok sayıda metin belgesine sahip olmak (doğal dilde, yapılandırılmamış), bazı semantik meta verilerle açıklama eklemenin olası yolları nelerdir? Örneğin, kısa bir belge düşünün: I saw the company's manager last day. Ondan bilgi alabilmek için, daha az belirsiz olması için ek verilerle açıklanması gerekir. Bu tür meta verileri bulma süreci söz …

3
Algoritma geliştirme nasıl büyütülür?
Keşifsel veri analizi ve algoritmalar geliştirirken, zamanımın çoğunun görselleştirme, bazı kod yazma, küçük veri kümesinde çalıştırma, tekrarlama döngüsünde harcandığını görüyorum. Sahip olduğum veriler bilgisayar görme / sensör füzyon tipi şeyler olma eğilimindedir ve algoritmalar görme açısından ağırdır (örneğin nesne algılama ve izleme vb.) Ve raf dışı algoritmalar bu bağlamda çalışmaz. …
18 algorithms 



Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.