İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

10
Neden sadece sinir ağlarını ve derin öğrenmeyi terk etmiyorsun? [kapalı]
Kapalı . Bu soru görüşe dayalı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Soruyu güncelleyin, böylece bu yayını düzenleyerek gerçekleri ve alıntıları yanıtlayabileceksiniz . 2 yıl önce kapandı . Genel olarak derin öğrenme ve sinir ağları ile ilgili temel problem. Eğitim verilerine uygun çözümler sonsuzdur. Sadece …


1
Önyükleme işleminin geçerli olduğunu gösteren bir sonuç var mı?
İstatistiğimizin istatistiklerinin dağıtım fonksiyonundan çizilen verilerinin bir fonksiyonu olduğunu varsayıyoruz . Örneğimizin ampirik dağılım işlevi . Bu nedenle, , rastgele bir değişken olarak görülen istatistiktir ve , istatistiğin bootstrap sürümüdür. KS mesafesi olarak kullanıyoruzX, 1 , ... x n F F θ ( F ) θ ( F ) D …

1
Doğrultulmuş lineer birimler neden doğrusal değildir?
Doğrultulmuş doğrusal birimlerin (ReLU) aktivasyon fonksiyonları neden doğrusal değildir? f(x)=max(0,x)f(x)=max(0,x) f(x) = \max(0,x) Girdi pozitif olduğunda doğrusaldırlar ve derin ağların temsili gücünü açmak benim anlayışımdan doğrusal olmayan aktivasyonlar bir zorunluluktur, aksi takdirde tüm ağ tek bir katmanla temsil edilebilir.

5
Eksik verileri işlemek için makine öğrenme algoritmaları
Laboratuvar değerleri de dahil olmak üzere yüksek boyutlu klinik verileri kullanarak öngörücü bir model geliştirmeye çalışıyorum. Veri alanı 5k örnek ve 200 değişken ile seyrek. Buradaki amaç, değişkenleri bir özellik seçim yöntemi (IG, RF vb.) Kullanarak sıralamak ve yordayıcı bir model geliştirmek için üst sıradaki özellikleri kullanmaktır. Özellik seçimi Naif …

2
Dirichlet dağılımından çizim
Diyelim ki -boyutlu vektör parametresi ile bir Dirichlet dağılımımız var . Bu dağılımdan bir numuneyi ( boyutlu bir vektörü) nasıl çizebilirim ? Basit bir açıklamaya ihtiyacım var.KKKα⃗ =[α1,α2,...,αK]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1, \alpha_2,...,\alpha_K]KKK

4
Bağımsız Rasgele Değişkenlerin İşlevleri
Bağımsız rastgele değişkenlerin fonksiyonlarının kendi başlarına bağımsız olduğu iddiası doğru mu? Bu sonucun, bazı örneklerde, örneğin örnek ortalama ile normal dağılımın örnek varyansı arasındaki bağımsızlığın kanıtı olarak, dolaylı olarak kullanıldığını gördüm, ancak bunun için gerekçe bulamadım. Görünüşe göre bazı yazarlar bunu olduğu gibi kabul ediyorlar ama bunun her zaman böyle …

2
Lojistik regresyonun arkasındaki sezgi
Son zamanlarda makine öğrenimi görmeye başladım, ancak lojistik regresyonun ardındaki sezgiyi anlamadım . Aşağıda anladığım lojistik regresyon ile ilgili gerçekler var. Hipotezin temeli olarak sigmoid fonksiyonunu kullanıyoruz . O yüzden anlıyorum bir doğru seçim bu kadar ancak neden sadece anlamıyorum seçim. Hipotez, uygun çıkışın olması olasılığını temsil eder , bu …

3
Bayesanlar dağılımları nasıl karşılaştırırlar?
Dolayısıyla, frekansçı olasılık ve istatistiksel analizin temellerini (ve ne kadar kötü kullanılabileceğini) iyi bir şekilde kavradığımı düşünüyorum. Sık sık dünyada, bu dağılımın bu dağılımdan farklı olduğu şeklinde bir soru sormak mantıklıdır, çünkü dağılımların gerçek, nesnel ve değişmez olduğu varsayılır (en azından belirli bir durum için) ve Bir numunenin, başka bir …

5
Hiç ikili değişkenleri standartlaştırmalı mıydınız?
Bir dizi özelliğe sahip bir veri setim var. Bazıları ikilidir aktif veya ateşlenmiş, etkin değil veya hareketsiz) ve gerisi gerçek , örneğin .0 = 4564.342)( 1 =(1=(1=0 =0=0=4564.3424564.3424564.342 Bu verileri bir makine öğrenme algoritmasına beslemek istiyorum, bu yüzden tüm gerçek değerli özellikleri puanladım. Onları yaklaşık ila arasında buluyorum . Şimdi …

3
SVM gibi ayrık sınıflandırıcılar için ROC eğrisi: Neden hala “eğri” diyoruz? Bu sadece bir “nokta” değil mi?
Tartışma: İkili sınıflandırma için bir roc eğrisinin nasıl üretileceğini , sanırım kargaşanın bir "ikili sınıflandırıcı" nın (2 sınıfı ayıran herhangi bir sınıflandırıcı olan) Yang için "ayrık sınıflandırıcı" olarak adlandırıldığı (bunun üreten olduğu) olduğunu düşünüyorum. kesikli çıkışlar bir SVM gibi 0/1 çıkışları ve ANN veya Bayes sınıflandırıcıları gibi sürekli çıkışlar değil …

1
Bire bir arada bırakılma çapraz doğrulama nasıl çalışır? farklı modelden son model nasıl seçilir ?
Bazı verilerim var ve bu verilerden bir model oluşturmak (doğrusal bir regresyon modeli demek) istiyorum. Bir sonraki adımda, modele Model Bir-Out-Out-Cross-Validation (LOOCV) uygulamak istiyorum; LOOCV'nin doğru olduğunu anladıysam, bu örnek dışındaki her örneği (eğitim seti) kullanarak, numunelerimin her biri için (test seti) yeni bir model oluşturdum. Daha sonra modeli test …

1
Satır ve sütun uzunluğu üzerindeki kısıtlamaları olan rastgele matrisler
satırları ve sütunlarıyla rastgele kare olmayan matrisler oluşturmalı, rasgele ortalama = 0 ile dağıtılmış elemanlar oluşturmalı ve her satırın uzunluğu (L2 normu) ve her sütunun uzunluğu kısıtlanmalı. . Eşdeğer olarak, her satır için kare değerlerin toplamı 1 ve her sütun için .C 1 √R,RRCCC111 RR,C--√RC\sqrt{\frac{R}{C}}R,CRC\frac{R}{C} Şimdiye kadar bunu başarmanın bir …

3
R-kolonunda matris normalleşmesi [kapalı]
Kapalı. Bu soru konu dışı . Şu anda cevapları kabul etmiyor. Bu soruyu geliştirmek ister misiniz? Sorunuzu güncelleyin o yüzden -konu üzerinde Çapraz doğrulanmış için. 6 yıl önce kapandı . Bir matrisin sütun şeklinde normalleşmesini R'de yapmak istiyorum. Bir matris verildiğinde m, her bir sütunu sütunların toplamına bölerek her sütunu …

2
R zaman serisi vektörlerin alt kümeleri
Bir zaman serisine sahibim ve başlangıç, son ve sıklığı koruyarak bir zaman dizisi olarak tutarken alt kümesini belirlemek istiyorum. Örneğin, bir zaman serim olduğunu varsayalım: > qs <- ts(101:110, start=c(2009, 2), frequency=4) > qs Qtr1 Qtr2 Qtr3 Qtr4 2009 101 102 103 2010 104 105 106 107 2011 108 109 …
25 r  time-series 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.