«deep-learning» etiketlenmiş sorular

Derin Öğrenme, amacı "derin" olan (birçok katmandan oluşan) özel sinir ağı mimarilerini kullanarak karmaşık işlevleri öğrenmek olan bir makine öğrenimi alanıdır. Bu etiket, derin öğrenme mimarilerinin uygulanmasıyla ilgili sorular için kullanılmalıdır. Genel makine öğrenimi soruları "makine öğrenimi" olarak etiketlenmelidir. İlgili yazılım kitaplığı için bir etiket eklemek (örneğin, "keras", "tensorflow", "pytorch", "fast.ai" vb.) Faydalıdır.

2
Keras'ta birçok LSTM örneği
LSTM'leri ve Keras ile nasıl inşa edileceğini anlamaya çalışıyorum. Bir RNN'yi çalıştırmak için temel olarak 4 mod olduğunu öğrendim (resimde sağdaki 4 mod) Resim kaynağı: Andrej Karpathy Şimdi Keras'ta her biri için minimalist bir kod parçacığının nasıl görüneceğini merak ediyorum. Yani şöyle bir şey model = Sequential() model.add(LSTM(128, input_shape=(timesteps, data_dim))) …



7
TensorFlow'da gradyan kırpma nasıl uygulanır?
Örnek kodu göz önünde bulundurarak . Gradyanların patlaması olasılığının olduğu RNN'de bu ağda gradyan kırpmanın nasıl uygulanacağını bilmek istiyorum. tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) Bu, kullanılabilecek bir örnek ama bunu nerede tanıtabilirim? RNN'nin aksine lstm_cell = rnn_cell.BasicLSTMCell(n_hidden, forget_bias=1.0) # Split data because rnn cell needs a list of inputs for the …

5
Modeli doğrularken Keras'ta ayrıntılı kullanım nedir?
LSTM modelini ilk kez çalıştırıyorum. İşte modelim: opt = Adam(0.002) inp = Input(...) print(inp) x = Embedding(....)(inp) x = LSTM(...)(x) x = BatchNormalization()(x) pred = Dense(5,activation='softmax')(x) model = Model(inp,pred) model.compile(....) idx = np.random.permutation(X_train.shape[0]) model.fit(X_train[idx], y_train[idx], nb_epoch=1, batch_size=128, verbose=1) Modeli eğitirken ayrıntılı kullanım nedir?

6
TensorFlow'da önceden eğitilmiş bir kelime yerleştirme (word2vec veya Glove) kullanma
Yakın zamanda evrişimli metin sınıflandırması için ilginç bir uygulamayı gözden geçirdim . Ancak incelediğim tüm TensorFlow kodu, aşağıdakiler gibi rastgele (önceden eğitilmemiş) gömme vektörleri kullanıyor: with tf.device('/cpu:0'), tf.name_scope("embedding"): W = tf.Variable( tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0), name="W") self.embedded_chars = tf.nn.embedding_lookup(W, self.input_x) self.embedded_chars_expanded = tf.expand_dims(self.embedded_chars, -1) Word2vec veya GloVe önceden eğitilmiş bir …

10
TensorFlow'da düzenlilik nasıl eklenir?
TensorFlow kullanılarak uygulanan birçok kullanılabilir sinir ağı kodunda, düzenleme terimlerinin genellikle kayıp değerine manuel olarak ek bir terim ekleyerek uygulandığını gördüm. Sorularım: Manuel olarak yapmaktan daha zarif veya önerilen bir düzenleme yöntemi var mı? Bunun get_variablebir argümanı olduğunu da görüyorum regularizer. Nasıl kullanılmalıdır? Biz gibi (buna bir regularizer geçirirseniz benim …

5
neden dizileri pytorch ile "paketliyoruz"?
Rnn için değişken uzunluklu dizi girdileri için paketlemeyi nasıl kullanacağımı kopyalamaya çalışıyordum ama sanırım önce sırayı neden "paketlememiz" gerektiğini anlamam gerekiyor. Onları neden "doldurmamız" gerektiğini anlıyorum ama "paketlemek" (doldurmak) neden pack_padded_sequencegerekli? Herhangi bir üst düzey açıklama memnuniyetle karşılanacaktır!

6
PyTorch - bitişik ()
Github (bağlantı) üzerinde bir LSTM dil modeli örneğini inceliyordum . Genel olarak ne yaptığı benim için oldukça açık. Ama hala contiguous()kodda birkaç kez gerçekleşen aramanın ne yaptığını anlamakta zorlanıyorum . Örneğin kod girişinin 74/75 satırında ve LSTM'nin hedef dizileri yaratılır. Veri (depolanan ids) 2 boyutludur ve birinci boyut, parti boyutudur. …


4
Tensorflow'da global_step ne anlama geliyor?
Bu, TensorFlow web sitesinden öğretici koddur . biri ne anlama global_stepgeldiğini açıklamaya yardımcı olabilir mi? Tensorflow web sitesinde, küresel adımın eğitim adımlarını saymak için kullanıldığını yazdım , ancak tam olarak ne anlama geldiğini tam olarak anlayamıyorum . Ayrıca, kurulum sırasında 0 rakamı ne anlama geliyor global_step? def training(loss,learning_rate): tf.summary.scalar('loss',loss) optimizer …

6
Keras, bir model eğittikten sonra nasıl tahmin ederim?
Reuters örnek veri setiyle oynuyorum ve iyi çalışıyor (modelim eğitilmiş). Bir modeli nasıl kaydedeceğimi okudum, böylece daha sonra tekrar kullanmak için yükleyebilirim. Ancak bu kaydedilmiş modeli yeni bir metni tahmin etmek için nasıl kullanırım? Kullanıyor muyum models.predict()? Bu metni özel bir şekilde hazırlamam gerekiyor mu? İle denedim import keras.preprocessing.text text …

5
Eğitim sırasında nans'ın yaygın nedenleri
Eğitim sırasında sık sık karşılaşılan bir olay olduğunu fark ettim NAN. Çoğu zaman, iç üründeki / tam bağlantılı veya şişen evrişim katmanlarındaki ağırlıklar tarafından ortaya çıkarılmış gibi görünmektedir. Bu, gradyan hesaplaması patladığı için mi oluyor? Yoksa bunun nedeni ağırlık başlatma mıdır (öyleyse, ağırlık başlatma neden bu etkiye sahiptir)? Yoksa giriş …

1
Keras'ta TimeDistributed katmanın rolü nedir?
TimeDistributed wrapper'ın Keras'ta ne yaptığını anlamaya çalışıyorum. TimeDistributed'ın "bir girdinin her geçici dilimine bir katman uyguladığını" anlıyorum. Ama biraz deney yaptım ve anlayamadığım sonuçları aldım. Kısacası, LSTM katmanıyla bağlantılı olarak TimeDistributed ve just Dense katman aynı sonuçları verir. model = Sequential() model.add(LSTM(5, input_shape = (10, 20), return_sequences = True)) model.add(TimeDistributed(Dense(1))) …

2
Özel TensorFlow Keras optimize edici
tf.kerasAPI (TensorFlow sürümü> = 2.0 kullanarak) ile uyumlu bir özel optimizer sınıfı yazmak istediğinizi varsayalım . Uygulamalarda yapılanlara karşı bunu yapmanın belgelenmiş yolu hakkında kafam karıştı. tf.keras.optimizers.Optimizer Devletler için belgeler , ### Write a customized optimizer. If you intend to create your own optimization algorithm, simply inherit from this class …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.