İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

3
PCA'nın Doğrusallığı
PCA doğrusal bir prosedür olarak kabul edilir, ancak: P C A (X) ≠ P Cı A ( x1) + P C A ( X2) + … + P C A ( Xn) ,PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), burada . Bu veriler matrisler üzerinde PCAs ile elde özvektörler yani x i veri matrisleri toplamına …
35 pca  linear 

5
Bir bayesian gibi düşünün, sık görüşme yapın: Bu ne anlama geliyor?
Burada bulunabilecek bir veri bilimi dersinde bazı ders slaytlarına bakıyorum: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf Maalesef bu ders için videoyu göremiyorum ve slaytın bir noktasında sunum yapan kişi şu metni içeriyor: Bazı Anahtar İlkeler Bir Bayesian gibi düşünün, bir Frequentist (uzlaşma) gibi kontrol edin Bunun ne anlama geldiğini bilen var mı? Bundan toplanacak bu …

3
Bir kümeleme yöntemi nasıl seçilir? Bir küme çözümü nasıl doğrulanır (yöntem seçimini garanti etmek için)?
Küme analizi ile ilgili en büyük sorunlardan biri, kullanılan farklı kümeleme yöntemlerine (hiyerarşik kümelemede farklı bağlantı yöntemleri dahil) dayandığında farklı sonuçlar çıkarmamız gerektiğidir . Bu konudaki fikrinizi bilmek istiyorum - hangi yöntemi seçeceksiniz ve nasıl. Biri “en iyi kümeleme yöntemi, size doğru cevabı verendir”; ancak küme analizinin denetimsiz bir teknik …

11
Neden 8 rastgele bit üretiliyor (0, 255)?
8 rastgele bit (ya da 0 veya 1) üretiyorum ve bunları 8 bitlik bir sayı oluşturmak üzere bir araya getiriyorum. Basit bir Python simülasyonu, ayrık küme üzerinde eşit bir dağılım verir [0, 255]. Bunun neden kafamda anlamlı olduğunu haklı çıkarmaya çalışıyorum. Bunu 8 jeton çevirerek karşılaştırırsam, beklenen değer 4 kafa …

2
Doğrusal Regresyon için Gradyan Artırma - Neden Çalışmıyor?
Gradient Boosting hakkında bilgi edinirken, metodun model oluşturmak ve birleştirmek için kullandığı "zayıf bir sınıflandırıcı" nın özellikleriyle ilgili herhangi bir kısıtlama duymadım. Ancak, doğrusal regresyon kullanan bir GB uygulamasının hayal bile edemedim ve aslında bazı testler yaptığımda, işe yaramadı. En standart yaklaşımı toplam kare artıkları gradyanı ile test ediyordum ve …

4
LSTM, kaybolma gradyan problemini nasıl önler?
LSTM, kaybolan degrade sorununu önlemek için özel olarak icat edildi. Bunu, aşağıdaki diyagramdaki ( Greff ve diğerleri ) hücre çevresindeki halkaya karşılık gelen Sabit Hata Atlıkarınca (CEC) ile yapması gerekiyordu . (kaynak: deeplearning4j.org ) Ve o kısmın bir çeşit kimlik işlevi olarak görülebildiğini anlıyorum, bu yüzden türev bir ve gradyan …



6
Monte Carlo Simülasyonu kullanarak yaklaşık
Son zamanlarda Monte Carlo simülasyonuna baktım ve onu ( yaklaşık bir dikdörtgen, orantılı alan içinde) gibi sabitleri yaklaşık olarak belirlemek için kullanıyorum .ππ\pi Bununla birlikte, Monte Carlo entegrasyonunu kullanarak [Euler sayısı] değerine yaklaşmak için uygun bir yöntem düşünemiyorum .eee Bunun nasıl yapılabileceği hakkında herhangi bir işaret var mı?


6
Kısa süreli seriler için en iyi yöntem
Kısa zaman serilerinin modellenmesi ile ilgili bir sorum var. Bunları modellemek bir soru değil , nasıl yapılır? Kısa zaman serilerinin modellenmesi için hangi yöntemi önerirsiniz (uzunluk )? "En iyisi" derken, burada en sağlam olanı kastetmiştim; bu, sınırlı sayıda gözlemden dolayı hatalara en az eğilimi gösterir. Kısa serilerde, tek gözlemler tahminleri …

5
Otokorelasyon testi: Ljung-Box ve Breusch-Godfrey'e karşı
Ham verilerde veya model kalıntılarında otokorelasyon testi için oldukça sık kullanılan Ljung-Box testini görmeye alışkınım. Breusch-Godfrey testi gibi başka bir otokorelasyon testi olduğunu neredeyse unutmuştum. Soru: Ljung-Box ve Breusch-Godfrey testlerinin temel farklılıkları ve benzerlikleri nelerdir ve biri diğerine ne zaman tercih edilmelidir? (Referanslar bekliyoruz. Her ne kadar bir kaç ders …

4
Bir dağılımın sonsuz ortalama ve varyansı nasıl olabilir?
Aşağıdaki örneklerin verilebileceği takdir edilecektir: Sonsuz ortalama ve sonsuz varyanslı dağılım. Sonsuz ortalama ve sonlu varyanslı dağılım. Sonlu ortalama ve sonsuz varyanslı dağılım. Sonlu ortalama ve sonlu varyanslı dağılım. Wilmott forumunda / web sitesinde bir yazı okuduğum, okuduğum ve okuduğum ve yeterince açık bir açıklama bulamadığım bir makalede kullanılan bu …

5
Simpson'ın paradoksunu nasıl çözebilirim?
Simpson'ın paradoksu dünya çapında tanıtım istatistik derslerinde tartışılan klasik bir bilmecedir. Ancak kursum, bir sorunun var olduğunu ve bir çözüm sağlamadığını basitçe not etmekten memnuniyet duyuyordu. Paradoksu nasıl çözeceğimi bilmek istiyorum. Bu, Simpsonların paradoksuyla karşı karşıya kaldığında, verinin nasıl bölümlendiğine bağlı olarak en iyi seçim olmak için iki farklı seçeneğin …

2
Çoklu regresyon veya kısmi korelasyon katsayısı? Ve ikisi arasındaki ilişkiler
Bu sorunun bir anlam ifade edip etmediğini bile bilmiyorum, ancak çoklu regresyon ve kısmi korelasyon arasındaki fark nedir (korelasyon ve regresyon arasındaki bariz farklar dışında, neyi hedeflediğim değil)? Aşağıdakileri istiyorum: İki bağımsız değişkenim ( , ) ve bir bağımlı değişkenim ( ) var. Şimdi bireysel olarak bağımsız değişkenler bağımlı değişkenle …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.