Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap

2
Parti normalizasyonu sigmoidlerin ReLU'lardan daha iyi çalıştığı anlamına mı geliyor?
Parti normalizasyonu ve ReLU'ların her ikisi de yok olan gradyan problemine çözümlerdir. Parti normalizasyonu kullanıyorsanız, sigmoid kullanmalı mıyız? Ya da parti normu kullanırken bile onları değerli kılan ReLU'ların özellikleri var mı? Sanırım toplu işte yapılan normalizasyon sıfır aktivasyon negatif gönderir. Bu, toplu işin "ölü ReLU" sorununu çözdüğü anlamına mı geliyor? …


1
Keras modelim arka planı neden tanımayı öğreniyor?
Bu Keras'ın Deeplabv3 + uygulamasını geliştirmeye çalışıyorum uygulamasını Pascal VOC2012 üzerinde, önceden eğitilmiş modeli (ve bu veri seti üzerinde eğitilmiş) kullanarak eğitmeye çalışıyorum. Hızla 1.0 yakınlaşan doğruluk ile garip sonuçlar var: 5/5 [==============================] - 182s 36s/step - loss: 26864.4418 - acc: 0.7669 - val_loss: 19385.8555 - val_acc: 0.4818 Epoch 2/3 …

4
SGDClassifier: Önceden bilinmeyen bir etikete sahip Çevrimiçi Öğrenme / partial_fit
Eğitim setim, ilk öğrenmeyi yaptığım yaklaşık 50 bin girdi içeriyor. Haftalık olarak ~ 5 bin giriş eklenir; ancak aynı miktar "kaybolur" (bir süre sonra silinmesi gereken kullanıcı verileri olduğu için). Bu nedenle çevrimiçi öğrenmeyi kullanıyorum çünkü daha sonra tam veri kümesine erişimim yok. Şu anda SGDClassifierçalışan bir tane kullanıyorum , …

2
Belirli bir kelimeyi ad, cep telefonu numarası, adres, e-posta, eyalet, ilçe, şehir vb. olarak sınıflandırmak için hangi makine / derin öğrenme / nlp teknikleri kullanılır?
Bir dizi kelimeyi veya dizeyi tarayabilen ve bunları makine öğrenimi veya derin öğrenme kullanarak adlar, cep telefonları, adresler, şehirler, eyaletler, ülkeler ve diğer varlıklar olarak sınıflandırabilen akıllı bir model oluşturmaya çalışıyorum. Yaklaşım aramıştım ama maalesef alacak bir yaklaşım bulamadım. Ben bir dize adı veya şehir vb olup olmadığını tahmin etmek …


1
Çok sınıflı veri kümesinde yanlış sınıflandırmaya neden olan dengesiz veriler
39 kategori / sınıf ve 8.5 milyon kaydım olan metin sınıflandırması üzerinde çalışıyorum. (Gelecekte veri ve kategoriler artacaktır). Verilerimin yapısı veya biçimi aşağıdaki gibidir. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 GB, RAM:4 GB,Primary Camera:12 MP Case cover …

2
Doğru noktayı seçmek için hangi algoritma uygulanacak
Aşağıdaki resim başlangıç ​​noktasında 7 noktayı göstermektedir. Bunlardan biri kurallar ve deneyime dayanarak bir insan tarafından seçildi ve kırmızı renkte (sol alt çeyrekte bulunan). Şimdi bu nokta kümelerinden 1000'den fazla var ve her set için bir insan tek bir nokta seçti. Bu koşullar tüm setler için geçerlidir: Her setin yaklaşık …


2
“Derin Noether Teoremi”: Simetri Kısıtlarında İnşa Etmek
İçsel bir simetriye sahip olması gereken bir öğrenme sorunum varsa, öğrenme sorunumu öğrenmeyi geliştirmek için bir simetri kısıtlamasına tabi tutmanın bir yolu var mı? Örneğin, görüntü tanıma yapıyorsam, 2D dönme simetrisi isteyebilirim. Bu, bir görüntünün döndürülmüş sürümünün orijinalle aynı sonucu alması gerektiği anlamına gelir. Ya da tic-tac-toe oynamayı öğreniyorsam, 90 …

1
Sınıflardan birinin 'diğerlerinden değil' ile tanımlandığı bir sınıflandırma problemine nasıl yaklaşırım?
Üç sınıf , , ilgilendiğimi varsayalım . Ancak veri aslında birkaç gerçek sınıf daha içeriyor .c1c1c_1c2c2c_2c3c3c_3(cj)nj=4(cj)j=4n(c_j)_{j=4}^n Açık cevap, , tüm sınıfları ifade eden yeni bir sınıfı tanımlamaktır , ancak örnekler nadir ve birbirine çok bunun iyi bir fikir olmadığından şüpheleniyorum .c^4c^4\hat c_4cjcjc_jj>3j>3j>3c^4c^4\hat c_4 Söylemeye çalıştığım şeyi görselleştirmek için aşağıdaki iki …


2
Bir CNN'yi otomatik kodlayıcı olarak eğitmek mantıklı mı?
Sonunda sınıflandırılması gereken EEG verilerini analiz etmek için çalışıyorum. Bununla birlikte, kayıtlar için etiket elde etmek biraz pahalıdır, bu da oldukça büyük miktarda etiketlenmemiş verilerimizi daha iyi kullanmam için denetimsiz yaklaşımları düşünmeme neden oldu. Bu doğal olarak iyi bir fikir olabilecek yığılmış oto-kodlayıcıların dikkate alınmasına yol açar. Bununla birlikte, bir …

4
Çok değişkenli zaman serilerini sınıflandırır
Yaklaşık 40 boyuta sahip zaman serilerinden (8 puan) oluşan bir veri setim var (bu yüzden her zaman serisi 8 x 40'tır). Karşılık gelen çıkış (kategoriler için olası sonuçlar) eitheir 0 veya 1'dir. Birden fazla boyuta sahip zaman serileri için bir sınıflandırıcı tasarlamak için en iyi yaklaşım hangisidir? İlk stratejim şu …

3
Hiper-parametre ayarlama esası test verisi ve model seçimi esası doğrulama verisi yaptıktan sonra son modeli tüm veriler üzerinde eğitmiyoruz?
Tüm verilerle demek istediğim tren + test + onaylama Hiperparametremi doğrulama verilerini kullanarak düzelttikten ve test verilerini kullanarak modeli seçtikten sonra, parametrelerin modelin eğitilmesi yerine daha iyi eğitilmesi için tüm veriler üzerinde eğitilmiş bir modelin olması daha iyi olmaz mı? tren verileri

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.