İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

1
Tip I, tip II ve tip III ANOVA ve MANOVA nasıl yorumlanır?
Birincil sorum, bir Tip I (sıralı) ANOVA yürütürken çıktının (katsayılar, F, P) nasıl yorumlanacağıdır? Özel araştırma problemim biraz daha karmaşık, bu yüzden örneğimi parçalara ayıracağım. Öncelikle, örümcek yoğunluğunun (X1) bitki büyümesi (Y1) üzerindeki etkisiyle ilgileniyorsam ve fideleri muhafazalara yerleştirdim ve örümcek yoğunluğunu değiştirdim, sonra verileri basit bir ANOVA veya lineer …

6
Kolmogorov'un dağılımlar arasındaki uzaklığı için motivasyon
İki olasılık dağılımının ne kadar benzer olduğunu ölçmenin birçok yolu vardır. Popüler olan yöntemler arasında (farklı çevrelerde): Kolmogorov mesafesi: dağıtım fonksiyonları arasındaki sup-mesafe; Kantorovich-Rubinstein mesafe: beklentileri arasındaki maksimum fark Lipschitz sabit fonksiyonların iki dağılımları wrt 111 de olduğu ortaya çıkıyor, L1L1L^1 dağılım fonksiyonları arasındaki mesafe; Sınırlı Lipschitz mesafesi: KR mesafesi …

8
Tüm modeller işe yaramaz mı? Herhangi bir model mümkün mü - veya faydalı mı?
Bu soru aklımda bir aydır iltihaplanma olmuştur. Amstat News'in Şubat 2015 sayısında Berkeley Profesörü Mark van der Laan'ın insanları yanlış model kullanmaları için azarlayan bir makalesi var . Modelleri kullanarak istatistiklerin bir bilimden ziyade bir sanat olduğunu belirtiyor. Ona göre, kişi her zaman “kesin modeli” kullanabilir ve bunu yapmamamızın “titizlik …

10
Tam olarak büyük veri nedir?
Birkaç defa soru sorulmuştu: Büyük Veri Nedir? Hem öğrenciler hem de akrabalarım tarafından istatistik ve ML ile ilgili buzz'ları toplayanlar. Bu CV-postasını buldum . Ve oradaki tek cevabı kabul ettiğimi hissediyorum. Vikipedi sayfası da üzerinde bazı yorumlar vardır, ama gerçekten orada her şeye katılıyorum eğer emin değilim. EDIT: (Wikipedia sayfasının …
44 large-data 


1
Adam stokastik gradyan iniş yöntemi nasıl çalışır?
Sinir ağlarını eğitmek için temel degrade iniş algoritmalarına aşinayım. Adam: ADAM: STOKASTİK OPTİMİZASYON İÇİN BİR YÖNTEM öneren makaleyi okudum . Kesinlikle en azından bazı görüşlere sahip olmama rağmen , kağıt benim için genel olarak çok yüksek görünüyor. Örneğin, bir maliyet fonksiyonu çoğu zaman birçok farklı fonksiyonun toplamıdır, bu nedenle değerini …

4
İstatistikçiler niçin önemli olmayan bir sonuç, sıfır hipotezini kabul etmenin aksine “null'u reddedemezsiniz” anlamına gelir?
İki örnek t-testi gibi geleneksel istatistiksel testler de, iki bağımsız örneğin bir fonksiyonu arasında bir fark olmadığı hipotezini ortadan kaldırmaya çalışmaya odaklanır. Sonra, bir güven düzeyi seçeriz ve araçların farkı% 95 seviyesinin üzerindeyse, boş hipotezi reddedebileceğimizi söyleriz. Olmazsa, "boş hipotezi reddedemeyiz". Bu da kabul edemeyeceğimiz anlamına geliyor. Boş hipotezin doğru …

4
Diğer özellik haritaları üretmek için özellik haritalarına çekirdekler nasıl uygulanır?
Evrişimli sinir ağlarının evrişim bölümünü anlamaya çalışıyorum. Aşağıdaki şekle bakarak: 4 özellik haritası elde etmek için girdi görüntüsüyle birlikte ettiğimiz 4 farklı çekirdeğin ( boyutunda) bulunduğu ilk evrişim katmanını anlama konusunda hiçbir sorunum yok .k×kk×kk \times k Anlamadığım şey, 4 özellik haritasından 6 özellik haritasına geçtiğimiz bir sonraki evrişim katmanıdır. …

5
Akademik makalelerde yayınlanan istatistikler
Bazı evrimsel / ekolojik akademik makaleleri okudum, bazen istatistiklerin 'gerçek dünyada' ders kitabının dışında nasıl kullanıldığını görmek amacıyla. Normalde kağıtları istatistik olarak müjde olarak alıyorum ve kağıtları istatistiksel olarak öğrenmeme yardımcı olmak için kullanıyorum. Ne de olsa, bir makale yazmak yıllar aldı ve titiz bir meslektaş incelemesinden geçmişse, o zaman …

6
En sevdiğiniz istatistiksel grafik hangisidir?
Bu benim favorim Bu örnek, mizahi bir damar içindedir (kredi, eski bir profesör Steven Gortmaker'a gider), ama aynı fikirlerinizle birlikte, bir istatistiksel görüş veya yöntemi güzel bir şekilde yakaladığınızı ve ilettiğinizi düşündüğünüz grafiklerle de ilgileniyorum. Cevap başına bir giriş. Tabii ki, bu soru aynı çizgi boyunca En sevdiğiniz "veri analizi" …


3
P-değerlerini birleştirirken, neden sadece ortalama almıyorsunuz?
Geçenlerde Fisher'ın p-değerlerini birleştirme yöntemini öğrendim. Bu, null altındaki p değerinin düzgün bir dağılımı takip etmesi ve ki bu dahice. Ama benim sorum, neden bu kıvrımlı yoldan gidiyor? ve niçin olmasın (neyin yanlış olduğu) sadece p-değerleri ortalamasını kullanıyor ve merkezi limit teoremini kullanıyor? ya da ortanca? Bu büyük planın arkasındaki …

7
Neden birileri klasik bir yaklaşım yerine 'bilgisiz' olmayan bir Bayesian yaklaşımını kullanır ki?
Eğer ilgi sadece bir modelin parametrelerini tahmin ediyorsa (nokta ve / veya aralık kestirimi) ve önceki bilgiler güvenilir değilse, zayıf, (bunun biraz belirsiz olduğunu biliyorum; öncelikli zor) ... Neden birisi klasik yaklaşım yerine 'bilgi verici olmayan' uygunsuz önceliklerle Bayesian yaklaşımını kullanmayı seçsin?

1
Hesaplama Cohen'in Kappa varyansı (ve standart hatalar)
Kappa ( κκ\kappa ) istatistiği, 1960 yılında, iki puanlayıcı arasındaki anlaşmayı ölçmek için Cohen [1] tarafından tanıtıldı. Bununla birlikte, varyansı bir süredir çelişkilerin kaynağı olmuştur. Benim sorum büyük örneklemlerde kullanılacak en iyi varyans hesaplamasının hangisi olduğu hakkında. Fleiss [2] tarafından test edilen ve doğrulanan birinin doğru seçim olduğuna inanmaya meyilliyim, …

8
Bayesian analizinin eksileri nelerdir?
Bayesian istatistik yöntemlerinin herhangi bir bağlamda kullanılmasına yönelik bazı pratik itirazlar nelerdir? Hayır, her zamanki seçim seçimini umursamıyorum demek istemiyorum. Bu cevap alamazsa çok sevinirim.
44 bayesian 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.