İstatistikler ve Büyük Veri

1

Tip I, tip II ve tip III ANOVA ve MANOVA nasıl yorumlanır?

Birincil sorum, bir Tip I (sıralı) ANOVA yürütürken çıktının (katsayılar, F, P) nasıl yorumlanacağıdır? Özel araştırma problemim biraz daha karmaşık, bu yüzden örneğimi parçalara ayıracağım. Öncelikle, örümcek yoğunluğunun (X1) bitki büyümesi (Y1) üzerindeki etkisiyle ilgileniyorsam ve fideleri muhafazalara yerleştirdim ve örümcek yoğunluğunu değiştirdim, sonra verileri basit bir ANOVA veya lineer …

45 r hypothesis-testing anova manova sums-of-squares

6

Kolmogorov'un dağılımlar arasındaki uzaklığı için motivasyon

İki olasılık dağılımının ne kadar benzer olduğunu ölçmenin birçok yolu vardır. Popüler olan yöntemler arasında (farklı çevrelerde): Kolmogorov mesafesi: dağıtım fonksiyonları arasındaki sup-mesafe; Kantorovich-Rubinstein mesafe: beklentileri arasındaki maksimum fark Lipschitz sabit fonksiyonların iki dağılımları wrt 111 de olduğu ortaya çıkıyor, L1L1L^1 dağılım fonksiyonları arasındaki mesafe; Sınırlı Lipschitz mesafesi: KR mesafesi …

45 distributions probability hypothesis-testing mathematical-statistics

8

Tüm modeller işe yaramaz mı? Herhangi bir model mümkün mü - veya faydalı mı?

Bu soru aklımda bir aydır iltihaplanma olmuştur. Amstat News'in Şubat 2015 sayısında Berkeley Profesörü Mark van der Laan'ın insanları yanlış model kullanmaları için azarlayan bir makalesi var . Modelleri kullanarak istatistiklerin bir bilimden ziyade bir sanat olduğunu belirtiyor. Ona göre, kişi her zaman “kesin modeli” kullanabilir ve bunu yapmamamızın “titizlik …

45 machine-learning maximum-likelihood modeling nonparametric parametric

10

Tam olarak büyük veri nedir?

Birkaç defa soru sorulmuştu: Büyük Veri Nedir? Hem öğrenciler hem de akrabalarım tarafından istatistik ve ML ile ilgili buzz'ları toplayanlar. Bu CV-postasını buldum . Ve oradaki tek cevabı kabul ettiğimi hissediyorum. Vikipedi sayfası da üzerinde bazı yorumlar vardır, ama gerçekten orada her şeye katılıyorum eğer emin değilim. EDIT: (Wikipedia sayfasının …

44 large-data

6

Olasılığın karşılığını bir şey temsil ediyor mu?

P'nin (X = 1) karşıtlığının özel bir şey ifade edip etmediğini merak ediyordum.

44 probability

1

Adam stokastik gradyan iniş yöntemi nasıl çalışır?

Sinir ağlarını eğitmek için temel degrade iniş algoritmalarına aşinayım. Adam: ADAM: STOKASTİK OPTİMİZASYON İÇİN BİR YÖNTEM öneren makaleyi okudum . Kesinlikle en azından bazı görüşlere sahip olmama rağmen , kağıt benim için genel olarak çok yüksek görünüyor. Örneğin, bir maliyet fonksiyonu çoğu zaman birçok farklı fonksiyonun toplamıdır, bu nedenle değerini …

44 neural-networks optimization gradient-descent adam

4

İstatistikçiler niçin önemli olmayan bir sonuç, sıfır hipotezini kabul etmenin aksine “null'u reddedemezsiniz” anlamına gelir?

İki örnek t-testi gibi geleneksel istatistiksel testler de, iki bağımsız örneğin bir fonksiyonu arasında bir fark olmadığı hipotezini ortadan kaldırmaya çalışmaya odaklanır. Sonra, bir güven düzeyi seçeriz ve araçların farkı% 95 seviyesinin üzerindeyse, boş hipotezi reddedebileceğimizi söyleriz. Olmazsa, "boş hipotezi reddedemeyiz". Bu da kabul edemeyeceğimiz anlamına geliyor. Boş hipotezin doğru …

44 hypothesis-testing statistical-significance confidence-interval equivalence tost

4

Diğer özellik haritaları üretmek için özellik haritalarına çekirdekler nasıl uygulanır?

Evrişimli sinir ağlarının evrişim bölümünü anlamaya çalışıyorum. Aşağıdaki şekle bakarak: 4 özellik haritası elde etmek için girdi görüntüsüyle birlikte ettiğimiz 4 farklı çekirdeğin ( boyutunda) bulunduğu ilk evrişim katmanını anlama konusunda hiçbir sorunum yok .k×kk×kk \times k Anlamadığım şey, 4 özellik haritasından 6 özellik haritasına geçtiğimiz bir sonraki evrişim katmanıdır. …

44 machine-learning neural-networks deep-learning conv-neural-network

5

Akademik makalelerde yayınlanan istatistikler

Bazı evrimsel / ekolojik akademik makaleleri okudum, bazen istatistiklerin 'gerçek dünyada' ders kitabının dışında nasıl kullanıldığını görmek amacıyla. Normalde kağıtları istatistik olarak müjde olarak alıyorum ve kağıtları istatistiksel olarak öğrenmeme yardımcı olmak için kullanıyorum. Ne de olsa, bir makale yazmak yıllar aldı ve titiz bir meslektaş incelemesinden geçmişse, o zaman …

44 publication-bias academia

6

En sevdiğiniz istatistiksel grafik hangisidir?

Bu benim favorim Bu örnek, mizahi bir damar içindedir (kredi, eski bir profesör Steven Gortmaker'a gider), ama aynı fikirlerinizle birlikte, bir istatistiksel görüş veya yöntemi güzel bir şekilde yakaladığınızı ve ilettiğinizi düşündüğünüz grafiklerle de ilgileniyorum. Cevap başına bir giriş. Tabii ki, bu soru aynı çizgi boyunca En sevdiğiniz "veri analizi" …

44 data-visualization

1

Çoklu rasgele değişkenlerin ürün varyansı

: Bu iki bağımsız değişkenin için yanıtı biliyoruz V a r (XY) = E( X2Y2) - ( E( XY) )2= V a r ( X) V a r ( Y)) + V a r ( X) ( E( Y) )2+ V a r ( Y) ( E( X) )2Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2 {\rm …

44 variance random-variable independence

3

P-değerlerini birleştirirken, neden sadece ortalama almıyorsunuz?

Geçenlerde Fisher'ın p-değerlerini birleştirme yöntemini öğrendim. Bu, null altındaki p değerinin düzgün bir dağılımı takip etmesi ve ki bu dahice. Ama benim sorum, neden bu kıvrımlı yoldan gidiyor? ve niçin olmasın (neyin yanlış olduğu) sadece p-değerleri ortalamasını kullanıyor ve merkezi limit teoremini kullanıyor? ya da ortanca? Bu büyük planın arkasındaki …

44 hypothesis-testing p-value multiple-comparisons central-limit-theorem combining-p-values

7

Neden birileri klasik bir yaklaşım yerine 'bilgisiz' olmayan bir Bayesian yaklaşımını kullanır ki?

Eğer ilgi sadece bir modelin parametrelerini tahmin ediyorsa (nokta ve / veya aralık kestirimi) ve önceki bilgiler güvenilir değilse, zayıf, (bunun biraz belirsiz olduğunu biliyorum; öncelikli zor) ... Neden birisi klasik yaklaşım yerine 'bilgi verici olmayan' uygunsuz önceliklerle Bayesian yaklaşımını kullanmayı seçsin?

44 bayesian inference prior likelihood information

1

Hesaplama Cohen'in Kappa varyansı (ve standart hatalar)

Kappa ( κκ\kappa ) istatistiği, 1960 yılında, iki puanlayıcı arasındaki anlaşmayı ölçmek için Cohen [1] tarafından tanıtıldı. Bununla birlikte, varyansı bir süredir çelişkilerin kaynağı olmuştur. Benim sorum büyük örneklemlerde kullanılacak en iyi varyans hesaplamasının hangisi olduğu hakkında. Fleiss [2] tarafından test edilen ve doğrulanan birinin doğru seçim olduğuna inanmaya meyilliyim, …

44 estimation variance reliability cohens-kappa

8

Bayesian analizinin eksileri nelerdir?

Bayesian istatistik yöntemlerinin herhangi bir bağlamda kullanılmasına yönelik bazı pratik itirazlar nelerdir? Hayır, her zamanki seçim seçimini umursamıyorum demek istemiyorum. Bu cevap alamazsa çok sevinirim.

44 bayesian