İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

30
Yaygın istatistiksel günahlar nelerdir?
Psikolojide çok iyi bir öğrenciyim ve istatistiklerle daha fazla bağımsız çalışmalara devam ettikçe, örgün eğitimimin yetersizliğinden dolayı şaşırıyorum. Hem kişisel hem de ikinci el tecrübesi, lisans ve lisansüstü eğitimdeki istatistiksel titizliğin yetersizliğinin psikoloji içinde her yerde bulunmadığını göstermektedir. Bu nedenle, kendim gibi bağımsız öğrencilerin, daha üstün (daha güçlü veya esnek …
227 fallacy 


5
Sinir ağını eğitmek için toplu iş hacmi ve yineleme sayısı
Bir sinir ağını eğitirken, ne tür bir fark yaratabilir? parti büyüklüğü ve yineleme sayısıaaabbb parti büyüklüğünü ve ile yineleme sayısınıcccddd nerede ?ab=cdab=cd ab = cd Aksi taktirde, sinir ağını aynı miktarda eğitim örneğiyle eğittiğimizi varsayarak, optimum parti büyüklüğünü ve yinelemenin sayısını nasıl ayarlayacağız? (parti büyüklüğü * yineleme sayısı = sinir …


12
Veri madenciliği, istatistik, makine öğrenmesi ve AI arasındaki fark nedir?
Veri madenciliği, istatistik, makine öğrenmesi ve AI arasındaki fark nedir? Çok benzer problemleri çözmeye çalışan 4 alan olduklarını söylemek doğru olur mu? Farklı yaklaşımlarla? Tam olarak ortak noktaları nedir ve nereleri farklıdır? Aralarında bir çeşit hiyerarşi varsa, ne olurdu? Daha önce de benzer sorular sorulmuştu ama hala anlamadım: Veri Madenciliği …

3
Makine öğrenim probleminizin umutsuz olduğunu nasıl bilebilirim?
Standart bir makine öğrenme senaryosu hayal edin: Çok değişkenli büyük bir veri kümesiyle karşı karşıya kalıyorsunuz ve oldukça bulanık bir anlayışınız var. Yapmanız gereken şey, sahip olduğunuza bağlı olarak bazı değişkenler hakkında tahminlerde bulunmaktır. Her zamanki gibi, verileri temizler, açıklayıcı istatistiklere bakar, bazı modelleri çalıştırır, bunları doğrular vb., Ancak birkaç …

10
Kovaryansı yalnızca ortalamayı anlayan birine nasıl açıklarsınız?
... varyans hakkındaki bilgilerini sezgisel bir şekilde (sezgisel olarak "anlamak" ) veya şunu söyleyerek artırabileceğimi farz edersek : Bu, veri değerlerinin 'ortalamadan' ortalama uzaklığıdır - ve varyans kare cinsindendir. birimleri, birimleri aynı tutmak için karekökü alırız ve buna standart sapma denir. Diyelim ki, bu çok şey ifade edildi ve (umarım) …

5
Hangi "ne zaman" kullanmak demek?
Yani aritmetik ortalama (AM), geometrik ortalama (GM) ve harmonik ortalama (HM) var. Onların matematiksel formülasyonları da ilişkili kalıplaşmış örnekleri ile birlikte iyi bilinmektedir (örneğin, Harmonik ortalama ve bununla ilgili problemleri hızlandırmak için uygulanması). Bununla birlikte, beni her zaman ilgilendiren bir soru, "belirli bir bağlamda kullanmak için en uygun olanın ne …
197 mean 

8
Otomatik model seçimi için algoritmalar
Otomatik model seçimi için bir algoritma uygulamak istiyorum. Kademeli bir regresyon yapmayı düşünüyorum ama her şey yapacaktır (ancak doğrusal regresyonlara dayanmalıdır). Benim sorunum bir metodoloji veya açık kaynaklı bir uygulama bulamamamdır (Java’da uyanıyorum). Aklımdaki metodoloji şöyle bir şey olurdu: Tüm faktörlerin korelasyon matrisini hesaplar birbiriyle düşük korelasyona sahip faktörleri seçmek …


12
Sıfırlar dahil olmak üzere negatif olmayan verileri nasıl dönüştürmeliyim?
Olumlu verilerim çok eğrilmişse, genellikle günlükleri alırım. Fakat sıfır içeren, eğri, negatif olmayan verilerle ne yapmalıyım? Kullanılan iki dönüşüm gördüm: ile eşleşen düzgün bir özelliğe sahip olan log ( x + 1 ) .kütük( x + 1 )kütük⁡(x+1)\log(x+1) burada c tahmin edilir veya çok küçük bir pozitif değer olarak ayarlanır.kütük( …

4
Bir sinir ağındaki gizli katman ne hesaplar?
Eminim ki birçok kişi 'sizin için google yapmama izin ver' bağlantılarıyla yanıt verecektir, bu yüzden bunu anlamaya çalıştığımı söylemek istiyorum, lütfen buradaki anlayış eksikliğimi affedin, ancak bunun nasıl olduğunu çözemiyorum. Bir sinir ağının pratik uygulaması aslında işe yarıyor. Giriş katmanını ve verilerin nasıl normalleştirileceğini anlıyorum, ayrıca önyargı birimini de anlıyorum, …


15
Veri bilimcisi nedir?
Doktora programımdan son zamanlarda istatistiklerden mezun olduktan sonra son birkaç aydır istatistik alanında iş aramaya başladım. Neredeyse her şirkette " Data Scientist " ünvanı olan bir iş ilanı vardı . Aslında, çoktan gitmiş gibi hissetmek, İstatistik Bilimcisi ya da İstatistikçi iş unvanlarını görmenin günleriydi . Veri bilimcisi olmak, istatistikçi olmanın …

4
Sinir ağında parti büyüklüğü nedir?
Python Keras packageSinir ağı için kullanıyorum . Bu bağlantı . Is batch_sizetesti numune sayısına eşittir? Wikipedia'dan şu bilgilere sahibiz : Bununla birlikte, diğer durumlarda, toplam gradyanı değerlendirmek, tüm summand işlevlerinden gradyanların pahalı değerlendirmelerini gerektirebilir. Eğitim seti muazzam olduğunda ve basit formüller olmadığında, gradyanların toplamını değerlendirmek çok pahalı olur çünkü gradyanı …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.