Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap


3
Paralel ve dağıtılmış bilgi işlem
Paralel ve dağıtılmış hesaplama arasındaki farklar nelerdir? Ölçeklenebilirlik ve verimlilik söz konusu olduğunda, makine kümelerindeki hesaplamalar ile ilgili çözümleri görmek çok yaygındır ve bazen paralel işleme veya dağıtılmış işleme olarak adlandırılır. Belirli bir şekilde, hesaplama her zaman paralel görünüyor, çünkü eşzamanlı olarak çalışan şeyler var. Ancak dağıtılmış hesaplama basitçe birden …


5
Cümle benzerlik tahmini
Aşağıdaki sorunu çözmek istiyorum: Veri kümem olarak bir dizi cümleyim var ve yeni bir cümle yazabilmek ve yeni kümenin veri kümesindeki en çok benzediği cümleyi bulmak istiyorum. Bir örnek şöyle görünecektir: Yeni cümle: " I opened a new mailbox" Veri kümesine dayalı tahmin: Sentence | Similarity A dog ate poop …

2
Benzersiz ziyaretçileri useragent, ip, session_id ile gruplandırma
Formdaki web sitesi erişim verileri session_id, ip, user_agentve isteğe bağlı olarak zaman damgası verildiğinde, aşağıdaki koşulları izleyerek, oturumları benzersiz ziyaretçilere en iyi nasıl kümeleyebilirsiniz? session_id: her yeni ziyaretçiye verilen bir kimliktir. Süresi dolmaz, ancak kullanıcı çerezleri kabul etmez / çerezleri temizler / tarayıcıyı değiştirir / cihazı değiştirirse, artık tanınmayacak IP …
15 clustering 


6
Keras - Transfer öğrenimi - Giriş tensörü şeklini değiştirme
Bu yazı yapmak istediğim şeyin mümkün olmadığını gösteriyor. Ancak, buna ikna olmadım - zaten yaptığım göz önüne alındığında, yapmak istediğim şeyin neden elde edilemediğini anlamıyorum ... Birinin şekil görüntülerinin (480, 720, 3), diğerinin ise şekil görüntülerinin (540, 960, 3) olduğu iki görüntü veri kümem var. Aşağıdaki kodu kullanarak bir model …
15 keras 




3
Keras'tan model.predict işlevinin çıktısı ne anlama geliyor?
Quora resmi veri kümesinde yinelenen soruları tahmin etmek için bir LSTM modeli oluşturdum. Test etiketleri 0 veya 1'dir. 1 soru çiftinin çift olduğunu gösterir. Kullanarak modeli oluşturduktan sonra model.fit, ben kullanarak modelin test model.predictdeney verileri üzerinde. Çıktı aşağıdaki gibi bir değer dizisidir: [ 0.00514298] [ 0.15161049] [ 0.27588326] [ 0.00236167] …

4
Farklı Test Seti ve Eğitim Seti Dağıtımı
Test setimin dağılımının eğitim setinden farklı olduğu bir veri bilimi yarışması üzerinde çalışıyorum. Test setine çok benzeyen eğitim setinden gözlemleri alt örneklemek istiyorum. Bunu nasıl yapabilirim?

2
SelectKBest nasıl çalışır?
Bu eğiticiye bakıyorum: https://www.dataquest.io/mission/75/improving-your-submission Bölüm 8'de en iyi özellikleri bularak aşağıdaki kodu gösterir. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, k=5) selector.fit(titanic[predictors], titanic["Survived"]) # Get the raw p-values for …

2
SMOTE'u metin sınıflandırmasına nasıl uygularsınız?
Sentetik Azınlık Aşırı Örnekleme Tekniği (SMOTE), dengesiz veri kümesi probleminde kullanılan bir aşırı örnekleme tekniğidir. Şimdiye kadar genel, yapılandırılmış verilere nasıl uygulanacağı hakkında bir fikrim var. Ancak metin sınıflandırma problemine uygulamak mümkün müdür? Verinin hangi kısmını fazla örneklemeniz gerekiyor? Bununla ilgili başka bir soru daha var, ancak bir cevabı yok. …

1
PyTorch vs. Tensorflow istekli
Google, yakın zamanda tensorflow'un her gece dahil olduğu tensorflow hesaplama özelliklerine erişmek için zorunlu bir API olan Eager modunu oluşturuyor . Tensorflow istekli PyTorch ile nasıl karşılaştırılır? Karşılaştırmayı etkileyebilecek bazı yönler şunlar olabilir: Statik grafik mirası nedeniyle istekli olmanın avantajları ve dezavantajları (örneğin, düğümlerdeki isimler). İkisinden birinin içsel sınırlamaları yoktur. …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.