İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap


1
SARIMAX sezgisel olarak nasıl anlaşılır?
Elektrik yükü tahmini ile ilgili bir yazıyı anlamaya çalışıyorum ama içerideki konseptlerle, özellikle de SARIMAX modeliyle mücadele ediyorum . Bu model yükü tahmin etmek için kullanılır ve anlamadığım birçok istatistiksel kavramı kullanır (Ben bir bilgisayar bilimi öğrencisiyim - beni istatistikte bir uzman olarak düşünebilirsiniz). Nasıl çalıştığını tamamen anlamama gerek yok …

4
Atlama katmanlı bağlantıları olan sinir ağı
Sinir ağları ile regresyon ilgileniyorum. Sıfır gizli düğümlü + atlama katmanı bağlantılı sinir ağları doğrusal modellerdir. Peki ya aynı sinir ağları ama gizli düğümleri var? Skip-layer bağlantılarının rolü ne olabilir merak ediyorum? Sezgisel olarak, atlama tabakası bağlantılarını eklerseniz, son modelin bir doğrusal model + bazı doğrusal olmayan parçaların toplamı olacağını …

3
Gama dağılımı ile normal dağılım arasındaki ilişki
Geçenlerde normal rastgele değişkenin karesi için ortalama 0 olan bir pdf türetmeyi gerekli buldum. Her ne sebeple, önceden varyansı normalleştirmemeyi seçtim. Bunu doğru yaptıysam, bu pdf aşağıdaki gibidir: N2(x;σ2)=1σ2π−−√x−−√e−x2σ2N2(x;σ2)=1σ2πxe−x2σ2 N^2(x; \sigma^2) = \frac{1}{\sigma \sqrt{2 \pi} \sqrt{x}} e^{\frac{-x}{2\sigma^2}} Bunun aslında bir gama dağılımının bir parametresi olduğunu fark ettim: N2(x;σ2)=Gamma(x;12,2σ2)N2(x;σ2)=Gamma⁡(x;12,2σ2) N^2(x; \sigma^2) …


5
Bir dizi bozuk para atmada bir kafa ve kuyruk desenine vurmak için geçen süre
Peter Donnelly'nin konuşma esinlenerek TED o belli desen sikke fırlatır bir dizi görünmesinin ne kadar süreceğini anlatılır ki, ben 'htt' iki paterni 'hth' ve Verilen R. aşağıdaki komut dosyasını oluşturan, onu Bu kalıplardan birine basmadan önce ortalama ne kadar sürdüğünü (yani kaç jeton attığını) hesaplar. coin <- c('h','t') hit <- …

4
Bir ARIMA modelini takmadan önce bir zaman serisini ne zaman günlüğe dönüştüreceğiniz
Önceden tek değişkenli zaman serilerini tahmin etmek için tahmini pro kullanmıştım , ancak iş akışımı R'ye değiştiriyorum. .arima (). Bazı durumlarda, tahmin uzmanı tahmin yapmadan önce dönüşüm verilerini günlüğe kaydetmeye karar verir, ancak bunun nedenini henüz anlamadım. Öyleyse sorum şu: ARIMA yöntemlerini denemeden önce zaman serilerimi ne zaman log-dönüşüm yapmalıyım? …

2
varyasyon otomatik kodlayıcıda KLD kaybı ve yeniden yapılanma kayıplarının ağırlığı
Bir VAE'yi gördüğüm neredeyse tüm kod örneklerinde, kayıp işlevleri şu şekilde tanımlanır (bu tensorflow kodudur, ancak theano, torch vb. için de benzer şekilde gördüm. , sadece toplamların alındığı ekseni etkiler): # latent space loss. KL divergence between latent space distribution and unit gaussian, for each batch. # first half of …

4
Dengesiz veri kümeleri için xgboost'ta scale_pos_weight'nin doğru kullanımı nedir?
Çok dengesiz bir veri setim var. Ayarlama önerisini ve kullanımını izlemeye çalışıyorum scale_pos_weightama nasıl ayarlayacağımı bilmiyorum. Gördüğümü görebiliyorum RegLossObj.GetGradient: if (info.labels[i] == 1.0f) w *= param_.scale_pos_weight dolayısıyla pozitif bir numunenin gradyanı daha etkili olacaktır. Ancak, xgboost kağıdına göre , gradyan istatistiği her zaman yerel olarak kullanılır = belirli bir ağaçtaki …

2
Bayesian yöntemlerinin fazla giyinmediği doğru mu?
Bayesian yöntemlerinin fazla giyinmediği doğru mu? (Bu iddiayı yapan bazı makaleleri ve dersleri gördüm) Örneğin, MNIST'e bir Gauss Süreci uygularsak (el yazısı basamaklı sınıflandırma), ancak yalnızca tek bir örnek gösterirsek, bu tek örneklemden farklı, ancak küçük olan fark için herhangi bir girdi için önceki dağıtıma geri dönecek mi?

1
Eski kitaplarda istatistiksel tablolar bilerek yanlış mı?
Bir süre önce eski (bilgisayar öncesi günlerde) kitaplarda, eklerde gösterilen teorik niceliklerin son rakamlarının intihalten vazgeçmesi için yanlış olduğunu hatırlıyorum (başka bir kitabın masasında bir tablo varsa son hanelerin sizinkiler ile aynı olanlara ek olması durumunda, o yazar masanızı çaldırmış olmalıdır). Bu hikaye için kaynak bulmaya çalışıyorum, ya da ondan …

1
Sınıflandırma ve regresyonu birleştiren bir algoritma var mı?
Aynı zamanda sınıflandırma ve regresyon yapabilen herhangi bir algoritma olup olmadığını merak ediyorum. Örneğin, algoritmanın bir sınıflandırıcı öğrenmesine izin vermek istiyorum ve her bir etiketin içinde aynı zamanda sürekli bir hedef öğreniyor. Bu nedenle, her eğitim örneği için kategorik bir etikete ve sürekli bir değere sahiptir. Önce bir sınıflayıcıyı eğitebilirim, …

5
Donanımlı bir model mutlaka işe yaramaz mı?
Bir modelin eğitim verilerinde% 100, ancak test verilerinde% 70 kesinliğe sahip olduğunu varsayalım. Aşağıdaki model bu model hakkında doğru mu? Bunun çok şık bir model olduğu açıktır. Test doğruluğu, aşırı takmayı azaltarak arttırılabilir. Ancak, bu model test verileri için kabul edilebilir bir doğruluğa sahip olduğundan hala faydalı bir model olabilir.


8
Makine Öğrenimi için ilkeli ve matematiksel teorilere sahip olmak neden bu kadar önemlidir?
Merak ediyorum, neden ilkeli / teorik makine öğrenmesi bu kadar önemli? İnsan olarak kişisel bir bakış açısıyla, ilkeli Makine Öğreniminin neden önemli olduğunu anlayabiliyorum: insanlar ne yaptıklarını anlamak gibi, güzelliği ve anlayışı memnuniyetle buluruz. kuramsal bakış açısından matematik eğlencelidir şeylerin tasarımını yönlendiren ilkeler olduğunda, rastgele tahminde bulunmak, garip deneme ve …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.