İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

3
Öklid mesafesinin normal dağılıma rastgele iki değişken arasındaki dağılımı nedir?
Kesin konumları bilinmeyen ancak bilinen parametrelere sahip normal dağılımlara göre dağıtılmış (örneğin ve iki nesne verildiğini varsayalım . Bunların her ikisinin de iki değişkenli normlar olduğunu varsayabiliriz; öyle ki, konumlar koordinatları üzerinde bir dağılımla tanımlanır (yani, ve , sırasıyla ve için beklenen koordinatlarını içeren vektörlerdir ). Ayrıca nesnelerin bağımsız olduğunu …


13
Ortanca yaş neden ortalama yaştan daha iyidir?
Wolfram Alpha'ya bakarsanız Veya bu Vikipedi sayfası Medyan yaşa göre ülkelerin listesi Açıkçası medyan , çağlar söz konusu olduğunda seçim istatistiği gibi görünüyor. Aritmetik ortalamanın neden daha kötü bir istatistik olabileceğini kendi kendime açıklayamıyorum . Neden bu kadar? Aslında burada yayınlanan çünkü bu sitenin var olduğunu bilmiyordum.
41 mean  median 


1
Hata önlemleri nasıl yorumlanır?
Weka'da sınıflandırmayı belirli bir veri kümesi için çalıştırıyorum ve nominal bir değeri tahmin etmeye çalışırsam, çıkışın özellikle doğru ve yanlış tahmin edilmiş değerleri gösterdiğini fark ettim. Ancak, şimdi sayısal bir özellik için çalıştırıyorum ve çıktı: Correlation coefficient 0.3305 Mean absolute error 11.6268 Root mean squared error 46.8547 Relative absolute error …

3
Normal ve Gauss Dağılımları arasındaki fark nedir
Normal ve Gauss dağılımları arasında derin bir fark var mı, onları ayırmadan kullanan birçok makale gördüm ve genellikle aynı şey olarak da bahsettim. Bununla birlikte, PI'm son zamanlarda bana, bir zamanlar önce başka bir çıkışta duyduğum, Gaussian'ın ortalama = 0 ve std = 1 olan özel durumunun normal olduğunu söyledi, …

3
nasıl hesaplayabilirim
Varsayalım ve Φ ( ⋅ ) yoğunluk fonksiyonu ve standart normal dağılımın dağılım işlevi vardır.ϕ ( ⋅ )ϕ(⋅)\phi(\cdot)Φ ( ⋅ )Φ(⋅)\Phi(\cdot) Bir integral nasıl hesaplanır: ∫∞- ∞Φ ( w - ab) Φ(w)d w∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw

9
F-ölçüm değerleri nasıl yorumlanır?
F-ölçüm değerleri arasındaki farkı nasıl yorumlayacağımı bilmek istiyorum. F-ölçüsünün hassasiyet ve geri çağırma arasında dengeli bir ortalama olduğunu biliyorum, ancak F-ölçülerindeki bir farkın pratik anlamını soruyorum. Örneğin, eğer bir C1 sınıflandırıcısı 0,4 kesinliği ve bir diğer 8 sınıflandırıcısı C2 0,8 kesinliğine sahipse, C2'nin C1 ile karşılaştırıldığında test örneklerinin çiftini doğru …

3
0 ile 1 arasında bir sonuç (oran veya kesir) için regresyon
oranını tahmin eden bir model inşa etmeyi düşünüyorum , burada ve ve . Dolayısıyla, oran ile arasında olacaktır .a ≤ b a > 0 b > 0 0 1a/ba/ba/ba≤ba≤ba \le ba>0a>0a > 0b>0b>0b > 0000111 Doğrusal regresyon kullanabilirim, ancak doğal olarak 0..1 ile sınırlı değildir. İlişkinin doğrusal olduğuna inanmak için …

5
Eğilim puanları bir regresyonda kovaryantlar eklemekten ne kadar farklıdır ve ikincisi ne zaman tercih edilir?
Eğilim puanları ve nedensel analizler için nispeten yeni olduğumu kabul ediyorum. Yeni gelen biri olarak benim için açık olmayan bir şey, eğilim puanlarını kullanarak “dengelemenin” bir regresyonda eş değişkenler eklediğimizde olanlardan matematiksel olarak nasıl farklı olduğu? Operasyonda farklı olan nedir ve neden regresyona alt popülasyon eş değişkenleri eklemekten daha iyidir? …

1
Softmax_cross_entropy_with_logits'in softmax_cross_entropy_with_logits_v2 den farkı nedir?
Özellikle, bu ifadeyi merak ediyorum galiba: TensorFlow'un gelecekteki ana sürümleri, gradyanların varsayılan olarak backprop'taki etiket girişlerine akmasına izin verecek. Kullandığımda gösteriliyor tf.nn.softmax_cross_entropy_with_logits. Aynı mesajda beni incelemeye çağırıyor tf.nn.softmax_cross_entropy_with_logits_v2. Dokümantasyona baktım, ancak yalnızca şunu belirtir tf.nn.softmax_cross_entropy_with_logits_v2: Geri yayılım hem logitlerde hem de etiketlerde gerçekleşecek. Etiketlerin geri yayılmasını engellemek için, etiket tensörlerini …

6
Rastgele Orman - Donanımın üstesinden nasıl gelinir?
Bilgisayar bilimi geçmişim var ama internette problem çözerek kendime veri bilimini öğretmeye çalışıyorum. Son birkaç haftadır bu problem üzerinde çalışıyorum (yaklaşık 900 satır ve 10 özellik). Başlangıçta lojistik regresyon kullanıyordum ama şimdi rastgele ormanlara geçtim. Rasgele orman modelimi eğitim verilerimde çalıştırdığımda auc için gerçekten yüksek değerler elde ediyorum (>% 99). …

3
İstatistiksel bağımsızlık nedensellik eksikliği anlamına mı geliyor?
İki rastgele değişken A ve B istatistiksel olarak bağımsızdır. Bu, işlemin DAG'sinde şu anlama gelir: ve elbette . Ancak bu, B'den A'ya hiçbir ön kapı olmadığı anlamına mı geliyor?(A⊥⊥B)(A⊥⊥B)(A {\perp\!\!\!\perp} B)P(A|B)=P(A)P(A|B)=P(A)P(A|B)=P(A) Çünkü o zaman almalıyız . Yani durum buysa, istatistiksel bağımsızlık otomatik olarak nedensellik eksikliği anlamına mı geliyor?P(A|do(B))=P(A)P(A|do(B))=P(A)P(A|do(B))=P(A)


4
Neden sigmoid başka bir şey yerine çalışıyor?
Neden fiili standart sigmoid fonksiyonu, 11+e−x11+e−x\frac{1}{1+e^{-x}} , (derin olmayan) sinir ağlarında ve lojistik regresyonda çok mu popüler? Neden daha hızlı işlem süresi veya daha yavaş bozunma ile diğer türetilebilir fonksiyonların birçoğunu kullanmıyoruz (bu yüzden kaybolma derecesi daha az gerçekleşir). Sigmoid fonksiyonları hakkında birkaç örnek Wikipedia'da . Yavaş yavaş bozulan ve …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.