Veri Bilimi

3

Veri Ölçekleme ve özellikle Standardizasyon yöntemini inceliyorum. Arkasındaki matematiği anladım, ancak özelliklere sıfır ortalama ve birim varyansı vermenin neden önemli olduğu açık değil. Bana açıklayabilir misin ?

10 machine-learning feature-scaling normalization

2

Bir görüntünün fotoğraf çekilip çekilmediğini nasıl tespit edebilirim?

İçeriği değiştirmek için manipüle edilmişlerse JPG dosyalarını kontrol etmek istiyorum. Ne düşündüğümü photoshopped DEĞİL: Kırpma dönen (Ölçek) Görüntü çözünürlüğü Akıllı telefonların yapabileceği otomatik değişiklikler Ne photoshopping düşünün: Eski görüntünün bölümlerinin üstüne yeni bir görüntü ekleme Görüntünün bir bölümünün metnini değiştirme Bu otomatik olarak nasıl kontrol edilebilir? (Ve: Bunun için kullanıma …

10 computer-vision

4

PCA bir makine öğrenme algoritması mıdır?

Temel bileşen analizinin boyutsallık azaltma tekniği olduğunu, yani 10 girdi özelliği verildiğinde, orijinal özelliklerin dik ve doğrusal dönüşümü olan daha az sayıda bağımsız özellik üreteceğini anladım. Mı PCAkendisi bir öğrenme algoritması olarak kabul veya veri işlem öncesi adımdır ile.

10 machine-learning pca

2

Neden L2 üzerinde L1 düzenlenmesi kullanılıyor?

Kayıp fonksiyonu kullanarak doğrusal regresyon modeli yürütmek, neden kullanmalıyım? L1L1L_1 onun yerine L2L2L_2 regularization? Aşırı takmayı önlemede daha iyi mi? Deterministik mi (yani her zaman benzersiz bir çözüm)? Özellik seçiminde daha iyi mi (çünkü seyrek modeller üretmek)? Ağırlıklar özellikler arasında dağılıyor mu?

10 linear-regression regularization

3

GPS koordinatları (enlem ve boylam) doğrusal bir modelde özellik olarak kullanılabilir mi?

Birçok özellik arasında GPS koordinatları (enlem ve boylam) içeren veri kümeleri var. Bu veri kümelerini aşağıdaki gibi sorunları araştırmak için kullanmak istiyorum: (1) başlangıç ve bitiş noktaları arasında sürmek için ETA hesaplamak; ve (2) belirli bir nokta için suç miktarının tahmin edilmesi. Doğrusal bir regresyon modeli kullanmak istiyorum. Ancak, bu …

10 machine-learning feature-selection linear-regression feature-extraction geospatial

2

Keras Son katmanda çoklu “Softmax” mümkün mü?

Keras'taki son katmanda birden fazla softmax uygulamak mümkün müdür? Böylece Düğüm 1-4 = 1 toplamı; 5-8 = 1; vb. Farklı bir ağ tasarımı mı tercih etmeliyim?

10 machine-learning keras multiclass-classification

2

Yalnızca 2 gizli katman kullanarak sayıları sıralayın

Ilya Sutskever ve Quoc Le'nin Sinir Ağları ile Sıralı Öğrenmeye Sıralı köşe kitabını okuyorum. İlk sayfada kısaca şu sözlerden bahsedilmektedir: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Herkes sadece 2 gizli katman kullanarak …

10 deep-learning

2

Çok sayıda özellik ile Lojistik Regresyon nasıl yapılır?

Lojistik Regresyon için bir ikili sınıf problemi ile her numune için 330 örnek ve 27 özelliğe sahip bir veri setim var. "On ise kural" a göre her özelliğin dahil edilmesi için en az 10 olaya ihtiyacım var. Yine de dengesiz bir veri setim var,% 20 pozitif sınıf ve% 80 negatif …

10 machine-learning python predictive-modeling logistic-regression data

1

En yakın komşu t-SNE ile bir anlam ifade ediyor mu?

Buradaki cevaplar t-SNE'deki boyutların anlamsız olduğunu ve noktalar arasındaki mesafelerin benzerlik ölçüsü olmadığını belirtmiştir . Ancak, t-SNE uzayındaki en yakın komşularına dayanan bir nokta hakkında bir şey söyleyebilir miyiz? Tam olarak aynı olan noktaların neden kümelenmediğine dair bu cevap , noktalar arasındaki mesafelerin oranının düşük ve yüksek boyutlu gösterimler arasında …

10 tsne

4

İşlev düzgünse neden eğim alçalmayı hızlandırır?

Şimdi "Scikit-Learn ve TensorFlow ile Uygulamalı Makine Öğrenimi" başlıklı bir kitap okudum ve bölüm 11'de ELU'nun (Üstel ReLU) açıklaması ile ilgili aşağıdaki açıklama var. Üçüncüsü, fonksiyon z = 0 dahil olmak üzere her yerde pürüzsüzdür, bu da z = 0'ın soluna ve sağına sıçramayacağı için Gradient Descent'i hızlandırmaya yardımcı olur. …

10 deep-learning gradient-descent

1

İngilizce bir cümlenin karmaşıklığı nasıl belirlenir?

İnsanların İngilizce'yi ikinci dil olarak öğrenmelerine yardımcı olmak için bir uygulama üzerinde çalışıyorum. Cümlelerin ekstra bağlam sağlayarak bir dil öğrenmeye yardımcı olduğunu doğruladım. Bunu 60 kişilik bir sınıfta küçük bir araştırma yaparak yaptım. Çeşitli İngilizce kelimeler için Wikipedia'dan yüz binden fazla cümle inceledim (Barrons'800 kelime ve en yaygın 1000 İngilizce …

10 machine-learning classification nlp text-mining

2

Word2vec'deki özellik matrisi nedir?

Sinir ağlarında yeni başlayan biriyim ve şu anda word2vec modelini araştırıyorum. Ancak özellik matrisinin tam olarak ne olduğunu anlamak için zor zamanlar geçiriyorum. İlk matrisin belirli bir kelime için bir sıcak kodlama vektörü olduğunu anlayabilirim, ancak ikinci matris ne anlama geliyor? Daha spesifik olarak, bu değerlerin her biri (yani 17, …

10 machine-learning neural-network word2vec

3

Bir DataFrame içinde ardışık sıfırları bulun ve koşullu bir değişiklik yapın

Ben böyle bir veri kümesi var: Örnek Veri Çerçevesi import pandas as pd df = pd.DataFrame({ 'names': ['A','B','C','D','E','F','G','H','I','J','K','L'], 'col1': [0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0], 'col2': [0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0]}) 0'İn' in col1ve 's col2ile bazılarını …

10 python pandas dataframe

3

Büyük karışıklık matrislerini okumayı nasıl kolaylaştırabilirim?

Geçenlerde 369 sınıflı bir veri kümesi ( link ) yayınladım . Sınıflandırma görevinin ne kadar zor olduğuna dair bir fikir edinmek için üzerinde birkaç deney yaptım. Genellikle, yapılan hata türünü görmek için karışıklık matrisleri varsa sevdim. Ancak,369 × 369369×369369 \times 369 matris pratik değildir. Büyük karışıklık matrisleri hakkında önemli bilgiler …

10 visualization confusion-matrix

1

DataFrame'i farklı python çekirdekleri arasında yeniden yüklemekten kaçının

Değişkeni (büyük tablo / veri çerçevesi) bellekte tutmanın ve onu birden çok ipython not defterinde paylaşmanın bir yolu var mı? Kavramsal olarak MATLAB'ın kalıcı değişkenlerine benzeyen bir şey arıyorum. Burada, birden fazla bağımsız düzenleyiciden (dizüstü bilgisayar) özel bir işlev / kitaplık çağırmak ve bu dış işlevin bazı sonuçları (veya büyük …

10 python bigdata matlab jupyter ipython