Veri Bilimi

Veri bilimi uzmanları, Makine Öğrenimi uzmanları ve alan hakkında daha fazla bilgi edinmek isteyenler için soru cevap


2
Bir görüntünün fotoğraf çekilip çekilmediğini nasıl tespit edebilirim?
İçeriği değiştirmek için manipüle edilmişlerse JPG dosyalarını kontrol etmek istiyorum. Ne düşündüğümü photoshopped DEĞİL: Kırpma dönen (Ölçek) Görüntü çözünürlüğü Akıllı telefonların yapabileceği otomatik değişiklikler Ne photoshopping düşünün: Eski görüntünün bölümlerinin üstüne yeni bir görüntü ekleme Görüntünün bir bölümünün metnini değiştirme Bu otomatik olarak nasıl kontrol edilebilir? (Ve: Bunun için kullanıma …

4
PCA bir makine öğrenme algoritması mıdır?
Temel bileşen analizinin boyutsallık azaltma tekniği olduğunu, yani 10 girdi özelliği verildiğinde, orijinal özelliklerin dik ve doğrusal dönüşümü olan daha az sayıda bağımsız özellik üreteceğini anladım. Mı PCAkendisi bir öğrenme algoritması olarak kabul veya veri işlem öncesi adımdır ile.

2
Neden L2 üzerinde L1 düzenlenmesi kullanılıyor?
Kayıp fonksiyonu kullanarak doğrusal regresyon modeli yürütmek, neden kullanmalıyım? L1L1L_1 onun yerine L2L2L_2 regularization? Aşırı takmayı önlemede daha iyi mi? Deterministik mi (yani her zaman benzersiz bir çözüm)? Özellik seçiminde daha iyi mi (çünkü seyrek modeller üretmek)? Ağırlıklar özellikler arasında dağılıyor mu?

3
GPS koordinatları (enlem ve boylam) doğrusal bir modelde özellik olarak kullanılabilir mi?
Birçok özellik arasında GPS koordinatları (enlem ve boylam) içeren veri kümeleri var. Bu veri kümelerini aşağıdaki gibi sorunları araştırmak için kullanmak istiyorum: (1) başlangıç ​​ve bitiş noktaları arasında sürmek için ETA hesaplamak; ve (2) belirli bir nokta için suç miktarının tahmin edilmesi. Doğrusal bir regresyon modeli kullanmak istiyorum. Ancak, bu …


2
Yalnızca 2 gizli katman kullanarak sayıları sıralayın
Ilya Sutskever ve Quoc Le'nin Sinir Ağları ile Sıralı Öğrenmeye Sıralı köşe kitabını okuyorum. İlk sayfada kısaca şu sözlerden bahsedilmektedir: A surprising example of the power of DNNs is their ability to sort N N-bit numbers using only 2 hidden layers of quadratic size Herkes sadece 2 gizli katman kullanarak …


1
En yakın komşu t-SNE ile bir anlam ifade ediyor mu?
Buradaki cevaplar t-SNE'deki boyutların anlamsız olduğunu ve noktalar arasındaki mesafelerin benzerlik ölçüsü olmadığını belirtmiştir . Ancak, t-SNE uzayındaki en yakın komşularına dayanan bir nokta hakkında bir şey söyleyebilir miyiz? Tam olarak aynı olan noktaların neden kümelenmediğine dair bu cevap , noktalar arasındaki mesafelerin oranının düşük ve yüksek boyutlu gösterimler arasında …
10 tsne 

4
İşlev düzgünse neden eğim alçalmayı hızlandırır?
Şimdi "Scikit-Learn ve TensorFlow ile Uygulamalı Makine Öğrenimi" başlıklı bir kitap okudum ve bölüm 11'de ELU'nun (Üstel ReLU) açıklaması ile ilgili aşağıdaki açıklama var. Üçüncüsü, fonksiyon z = 0 dahil olmak üzere her yerde pürüzsüzdür, bu da z = 0'ın soluna ve sağına sıçramayacağı için Gradient Descent'i hızlandırmaya yardımcı olur. …

1
İngilizce bir cümlenin karmaşıklığı nasıl belirlenir?
İnsanların İngilizce'yi ikinci dil olarak öğrenmelerine yardımcı olmak için bir uygulama üzerinde çalışıyorum. Cümlelerin ekstra bağlam sağlayarak bir dil öğrenmeye yardımcı olduğunu doğruladım. Bunu 60 kişilik bir sınıfta küçük bir araştırma yaparak yaptım. Çeşitli İngilizce kelimeler için Wikipedia'dan yüz binden fazla cümle inceledim (Barrons'800 kelime ve en yaygın 1000 İngilizce …

2
Word2vec'deki özellik matrisi nedir?
Sinir ağlarında yeni başlayan biriyim ve şu anda word2vec modelini araştırıyorum. Ancak özellik matrisinin tam olarak ne olduğunu anlamak için zor zamanlar geçiriyorum. İlk matrisin belirli bir kelime için bir sıcak kodlama vektörü olduğunu anlayabilirim, ancak ikinci matris ne anlama geliyor? Daha spesifik olarak, bu değerlerin her biri (yani 17, …


3
Büyük karışıklık matrislerini okumayı nasıl kolaylaştırabilirim?
Geçenlerde 369 sınıflı bir veri kümesi ( link ) yayınladım . Sınıflandırma görevinin ne kadar zor olduğuna dair bir fikir edinmek için üzerinde birkaç deney yaptım. Genellikle, yapılan hata türünü görmek için karışıklık matrisleri varsa sevdim. Ancak,369 × 369369×369369 \times 369 matris pratik değildir. Büyük karışıklık matrisleri hakkında önemli bilgiler …

1
DataFrame'i farklı python çekirdekleri arasında yeniden yüklemekten kaçının
Değişkeni (büyük tablo / veri çerçevesi) bellekte tutmanın ve onu birden çok ipython not defterinde paylaşmanın bir yolu var mı? Kavramsal olarak MATLAB'ın kalıcı değişkenlerine benzeyen bir şey arıyorum. Burada, birden fazla bağımsız düzenleyiciden (dizüstü bilgisayar) özel bir işlev / kitaplık çağırmak ve bu dış işlevin bazı sonuçları (veya büyük …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.