İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

6
Yeni Başlayanlar İçin İstatistik / Olasılık Videoları
Matematiksel İstatistik Videoları için zaten bir talep vardı , ama açıkça insanlardan istendi istatistiklerin titiz bir matematiksel sunumunu sağlayan videolar. yani, bu tartışmada belirtilen bir ders kitabını kullanan bir kursa eşlik edebilecek videolar ... Aynı zamanda merak ediyorum, stat / prob - 101 - video kursları için ne öneriniz var?
28 references 

4
İki kovaryans matrisi arasındaki benzerlik veya mesafenin ölçülmesi
İki simetrik kovaryans matrisi arasında benzerlik veya mesafe ölçütleri var mı (ikisi de aynı boyutlara sahip)? Burada, iki olasılık dağılımının KL farklılığına veya matrislere uygulanmadıkları sürece vektörler arasındaki Öklid mesafesine analogları düşünüyorum. Bir kaç benzerlik ölçümü olacağını hayal ediyorum. İdeal olarak, iki kovaryans matrisinin aynı olduğu gibi boş hipotezi test …

3
R ile önyükleme kullanarak p-değerini hesaplama
Yaklaşık 2 taraflı bootstrapped p değerini hesaplamak için "boot" paketini kullanıyorum, ancak sonuç t.test kullanmanın p değerinden çok uzak. R kodumda ne yanlış yaptığımı çözemiyorum. Birisi lütfen bana bunun için bir ipucu verebilir time = c(14,18,11,13,18,17,21,9,16,17,14,15, 12,12,14,13,6,18,14,16,10,7,15,10) group=c(rep(1:2, each=12)) sleep = data.frame(time, group) require(boot) diff = function(d1,i){ d = d1[i,] …

8
Sınırsız bir değişkeni 0 ile 1 arasında sayı olarak gösterme
Bir değişkeni 0 ile 1 arasında bir sayı olarak temsil etmek istiyorum. Değişken, doğal bir sınırı olmayan negatif olmayan bir tam sayıdır. 0 - 0 arasında eşlerim, ancak 1 ile 0 arasındaki rakamları ne eşleyebilirim? Limitleri sağlamak için bu değişkenin geçmişini kullanabilirim. Bu, eğer maksimum artış olursa eski istatistikleri yeniden …



4
Kullback-Leibler mesafesinin bir uyarlaması?
Bu resme bak: Kırmızı yoğunluktan bir örnek alırsak, o zaman bazı değerlerin 0.25'ten düşük olması beklenirken, mavi dağılımdan böyle bir örnek üretmek mümkün değildir. Sonuç olarak, Kullback-Leibler kırmızı yoğunluktan mavi yoğunluğa olan mesafe sonsuzdur. Ancak, iki eğri, bazı "doğal anlamda", o kadar belirgin değildir. İşte benim sorum: Bu iki eğri …

6
Kırılmış eksenlere alternatifler nelerdir?
Kullanıcılar genellikle aynı grafikte farklı büyüklükteki siparişlerin verilerini sunmak için eksen değerlerini kırmaya çalışırlar ( buraya bakın ). Bu uygun olsa da, verileri görüntülemek için her zaman tercih edilen yol değildir (en iyi ihtimalle yanıltıcı olabilir). Farklı büyüklük derecelerinde farklı olan verileri göstermenin alternatif yolları nelerdir? Verileri log-dönüştürmek veya kafes …

26
Günlük işlerinizde hangi R paketlerini en faydalı buluyorsunuz?
Yinelenen iş parçacığı: Az önce R'nin en son sürümünü yükledim. Hangi paketleri almalıyım? Verilerle günlük çalışmanızı hayal edemediğiniz R paketleri nelerdir ? Lütfen hem genel hem de özel araçları listeleyin. GÜNCELLEME: 24.10.10 gelince ggplot2, 7 oy ile daha akıllı görünüyor. Birden fazla belirtilen diğer paketler: plyr - 4 RODBC, RMySQL- …
28 r 

2
Neden ortalama kare hatası ampirik dağılım ve Gauss modeliyle çapraz entropidir?
5.5 yılında, Derin Öğrenme (Ian Goodfellow, Yoshua Bengio ve Aaron Courville tarafından), Olumsuz bir log olasılığından oluşan herhangi bir kayıp, eğitim seti tarafından belirlenen ampirik dağılım ile model tarafından tanımlanan olasılık dağılımı arasındaki çapraz entropidir. Örneğin, ortalama kare hatası, ampirik dağılım ve bir Gauss modeliyle çapraz entropidir. Neden eşdeğer olduklarını …

4
Neden colormap viridis'i jet üzerinde kullanıyorsunuz?
Https://www.youtube.com/watch?v=xAoljeRJ3lU’da açıklandığı gibi , Matplotlib varsayılan renk haritasını jetten viridis’e değiştirir. Ancak, pek iyi anlamıyorum. Belki de renk körü olduğum için? Orijinal colormap jet çok güçlü görünüyor, kontrastı hissedebiliyorum: Yeni colormap viridis bu kontrasttan yoksun olsa da: Birisi lütfen benim için daha basit açıklayabilir misiniz? Makalem için arsaya ihtiyacım var. …

6
Layman'ın ifadesi ile model ile dağılım arasındaki fark nedir?
Vikipedi'de tanımlanan cevaplar (tanımlar), yüksek matematik / istatistik bilgisine sahip olmayanlar için tartışmalı bir parça. Matematiksel olarak, istatistiksel bir model genellikle bir çift ( ) olarak düşünülür , burada olası gözlemler kümesidir, yani örnek alanı ve bir olasılık dağılımları kümesidir. üzerinde . S P SS, PS,PS, \mathcal{P}SSSPP\mathcal{P}SSS Olasılık ve istatistikte, …

1
Güzel yazılmış yazılar
David Salsburg'un kitabından Bayan çay tadımı : Okuyucu buna inanmasa da, edebi üslup matematik araştırmalarında önemli bir rol oynar. Bazı matematiksel yazarların anlaşılması kolay makaleler üretemedikleri görülmektedir. Diğerleri, genel fikrin pikayune'da kaybedildiği detaylarla dolu pek çok sembolik gösterim satırı üretmekten sapkın bir zevk alıyor gibi görünmektedir. Ancak bazı yazarlar, geliştirmenin …

6
Neden çok değişkenli regresyona ihtiyacımız var (bir grup tek değişkenli regresyonun aksine)?
Bu harika kitabı okudum: Johnson ve Wichern tarafından uygulanan çok değişkenli istatistiksel analiz . Buradaki ironi, ayrı tek değişkenli (regresyon) modeller yerine çok değişkenli (regresyon) modelleri kullanma motivasyonunu hala anlayamıyorum. Ben stats.statexchange mesajların geçti 1 ve 2 açıklamak katına ve çok değişkenli regresyon ve çok değişkenli regresyon sonuçlarının (b) yorumlama …

5
Rastgele yürüyüşün varyansı neden artıyor?
Rasgele yürüyüş olarak tanımlanır , beyaz gürültüdür. Mevcut pozisyonun bir önceki pozisyonun + öngörülemeyen bir terimin toplamı olduğunu gösterir.Yt=Yt−1+etYt=Yt−1+etY_{t} = Y_{t-1} + e_tetete_t Ortalama işlevinin olduğunu ispatlayabilirsiniz , çünküμt=0μt=0\mu_t = 0 E(Yt)=E(e1+e2+...+et)=E(e1)+E(e2)+...+E(et)=0+0+...+0E(Yt)=E(e1+e2+...+et)=E(e1)+E(e2)+...+E(et)=0+0+...+0E(Y_{t}) = E(e_1+ e_2+ ... +e_t) = E(e_1) + E(e_2) +... +E(e_t) = 0 + 0 + ... + …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.