Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap


3
Dengesiz, heterojen Negatif arka plana sahip Tek Sınıf ayrımcı sınıflandırma?
{Protein} dizilerini belirli bir sınıfa (Neuropeptide hormon öncüleri) ait olarak sınıflandırmak için mevcut bir denetimli sınıflandırıcıyı geliştirmeye çalışıyorum. Yaklaşık 13 milyon protein sekansının ("Bilinmeyen / zayıf açıklamalı arkaplan") arka planına karşı yaklaşık 1.150 bilinen "pozitif" veya çeşitli özelliklerle açıklamalı yaklaşık 100.000 gözden geçirilmiş, ilgili protein vardır (ancak açıkça çok az …

6
Birkaç sürekli değişkenin log dönüşümünü almanın arkasındaki sebep nedir?
Bir sınıflandırma problemi yapıyorum ve birçok insanın kodunu ve eğiticilerini okudum. Dikkatimizi çeken tek şey birçok kişi almasıdır np.logveya logsürekli benzeri değişken loan_amountveya applicant_incomevs. Sadece arkasındaki sebebi anlamak istiyorum. Model tahmin doğruluğunu artırmamıza yardımcı olur mu? Zorunlu mu? veya Arkasında mantık var mı? Lütfen mümkünse bazı açıklamalar sağlayın. Teşekkür ederim.

3
Keras'ta test verilerinin akışıyla ilgili predict_generator ile tahminler nasıl alınır?
In Keras sıfırdan eğitim convnets blog , kod gösterileri yalnızca ağ eğitim ve doğrulama verilerinin üzerinde çalışan. Test verileri ne olacak? Doğrulama verileri test verileriyle aynı mıdır (sanmıyorum). Tren ve doğrulama klasörleriyle benzer satırlarda ayrı bir test klasörü varsa, test verileri için bir karışıklık matrisi nasıl elde edilir. Bunu yapmak …

3
Xgboost'taki olasılıklar nasıl tahmin edilir?
Aşağıdaki tahmin fonksiyonu -ve değerleri de vermektedir, bu yüzden olasılık olamaz. param <- list(max.depth = 5, eta = 0.01, objective="binary:logistic",subsample=0.9) bst <- xgboost(param, data = x_mat, label = y_mat,nround = 3000) pred_s <- predict(bst, x_mat_s2) Google & denedim pred_s <- predict(bst, x_mat_s2,type="response") ama işe yaramadı. Soru Bunun yerine olasılıklar nasıl …



1
CNN'de geri yayılım
Aşağıdaki CNN var: 5x5 büyüklüğünde bir giriş görüntüsü ile başlıyorum Sonra 4x2 boyutunda özellik haritası üreten 2x2 çekirdeği ve adım = 1 kullanarak evrişim uyguluyorum. Sonra özellik haritasını 2x2 boyutuna küçülten stride = 2 ile 2x2 max-pooling uygularım. Sonra lojistik sigmoid uyguluyorum. Sonra 2 nöron ile tamamen bağlı bir katman. …

5
Özellik seçimi ve Özellik çıkarma. Ne zaman kullanılır?
Özellik çıkarma ve özellik seçimi, temel olarak verilerin boyutsallığını azaltır, ancak özellik çıkarma, eğer haklıysam, verileri daha ayrılabilir hale getirir. Hangi teknik diğerine ve ne zaman tercih edilir ? Özellik seçimi orijinal verileri ve özelliklerini değiştirmediği için, üzerinde çalıştığınız özelliklerin değişmemesi önemli olduğunda özellik seçimini kullanacağınızı düşünüyorum. Ama neden böyle …

1
RandomForestClassifier OOB puanlama yöntemi
Scikit-learn'daki rastgele orman uygulaması, torba dışı örneklerle genelleme hatasını tahmin etmek için puanlama yöntemi olarak ortalama doğruluk kullanıyor mu? Belgelerde bu belirtilmemiştir, ancak score () yöntemi ortalama doğruluğu rapor eder. Dengesiz bir veri kümem var ve ızgara aramasında puanlama ölçütüm olarak AUC of ROC kullanıyorum. Sınıflandırıcıya OOB örnekleri üzerinde de …

3
Sinir ağı eğitimi için kategorik ve sürekli giriş özellikleri nasıl birleştirilir
Kategorik ve sürekli olmak üzere iki tür giriş özelliğimiz olduğunu varsayalım. Kategorik veriler bir sıcak kod A olarak temsil edilebilirken, sürekli veriler N-boyutlu uzayda sadece bir B vektörüdür. Görünüşe göre sadece concat (A, B) kullanmak iyi bir seçim değildir çünkü A, B tamamen farklı veri türleridir. Örneğin, B'den farklı olarak, …

2
Neden bir kukla değişkeni atmamız gerekiyor?
Bir regresyon modeli oluşturmak için kategorik değişkenleri kukla değişkenlere dönüştürerek halletmemiz gerektiğini öğrendim. Örnek olarak, veri kümemizde konum gibi bir değişken varsa: Location ---------- Californian NY Florida Bunları şu şekilde dönüştürmeliyiz: 1 0 0 0 1 0 0 0 1 Bununla birlikte, kaç tane kukla değişken olursa olsun, bir kukla …

8
Yapay Sinir Ağlarını Nasıl Öğrenebilirim?
Şu anda sinir ağlarını kullanarak araştırma yapan bir birinci sınıf lisans öğrencisiyim (bundan söz ederek tanımadığımı affedebilirsiniz). Profesörün rehberliğinde üç düğümlü bir sinir ağını (işe yarayan) kodladım. Ancak yapay zeka ve veri biliminde bir kariyer yapmak istiyorum ve kendime bunlarla ilgili daha ayrıntılı bilgi vermek istiyorum. Sinir ağı yapıları, derin …


3
Derin öğrenme modeline yeni bir kategori nasıl eklenir?
Diyelim ki 10 nesneyi tanımak için önceden eğitilmiş bir ağda transfer öğrenimi yaptım. Daha önce eğitmiş olduğum 10 kategoriyi veya önceden eğitilmiş orijinal modeldeki bilgileri kaybetmeden ağın sınıflandırabileceği 11. bir öğeyi nasıl ekleyebilirim? Bir arkadaşım bana bu alanda aktif araştırmaların sürdüğünü söyledi, ancak aranacak herhangi bir makale veya isim bulamadım? …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.