İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

3
Doğrusal ve doğrusal olmayan regresyon modelleri arasındaki farkı nasıl anlatabilirim?
Lineer olmayan regresyon SAS Non Linear ile ilgili aşağıdaki linki okuyordum . “Doğrusal Olmayan Regresyona Karşı Doğrusal Regresyon” adlı ilk bölümü okuduğumdaki anlayış, aşağıdaki denklemin aslında doğrusal bir regresyon olduğuydu, doğru mu? Öyleyse neden? y=b1x3+b2x2+b3x+cy=b1x3+b2x2+b3x+cy = b_1x^3 + b_2x^2 + b_3x + c Am I also to understand that in …

4
R kullanarak boyutsal küçültme için PCA vs t-SNE'nin nesi yanlış?
336x256 kayan nokta sayıları (336 bakteri genomu (sütunlar) x 256 normalleştirilmiş tetranükleotit frekansı (satır), örneğin her sütun 1'e kadar ekler) matrisine sahibim. Analizimi prensip bileşen analizi kullanarak yaptığımda iyi sonuçlar alıyorum. Öncelikle, veri üzerindeki kmean kümelerini hesaplarım, daha sonra bir PCA çalıştırırım ve veri noktalarını başlangıçtaki 2 km'lik kümelemeye dayanarak …
27 r  pca  tsne 


17
Bir cümleyle istatistikler nasıl tarif edilir?
İstatistikleri öğrenmeye başladığımda, t-testi, ANOVA, ki-kare ve doğrusal regresyon gibi prosedürlerin her biri çok farklı canlılar gibi göründü. Ama şimdi bu prosedürlerin her birinin aynı şeyi yaptığını fark ediyorum. Benzer şekilde, varyans, artıklar, standart hata ve ortalama gibi değerler de aynı şeyi az çok ölçmektedir. Bu yüzden tüm bu prosedürleri …
27 definition 

4
Deneysel tasarımdaki tuzaklar: Ölü deneylerden kaçınma
Bu alıntıya defalarca rastladım: Bir deney bittikten sonra istatistikçiye danışmak çoğu zaman yalnızca ölüm sonrası bir inceleme yapmasını istemek içindir. Belki de deneyin neyin öldüğünü söyleyebilir. - Ronald Fisher (1938) Bana göre, belki biraz küstahça görünüyor. Deneylerin iyi tasarım olmadan nasıl öldüğünü açıklayan şimdiye kadar bulduğum tek örnek, kontrol eksikliği …

7
Korelasyon ilişkiye eşdeğer midir?
İstatistik profesörüm “korelasyon” kelimesinin kesinlikle değişkenler arasındaki doğrusal ilişkilere uygulandığını, “ilişkilendirme” kelimesinin her türlü ilişki için geniş çapta uygulandığını iddia ediyor. Başka bir deyişle, "doğrusal olmayan korelasyon" teriminin bir oksimoron olduğunu iddia ediyor. Vikipedi " Korelasyon ve bağımlılık " hakkındaki makalesinde bu bölümden ne yapabilirim , Pearson korelasyon katsayısı iki …

5
PCA'nın bir sınıflandırıcının sonuçlarını kötüleştirmesine ne sebep olabilir?
En iyi özellik kombinasyonlarını bulmak için ileriye doğru seçim yaptığım yüzlerce özellik ile birlikte çapraz doğrulama yaptığım bir sınıflandırıcı var. Bunu, PCA ile aynı deneyleri çalıştırmayla karşılaştırıyorum, burada potansiyel özellikleri alıyorum, SVD uyguladım, orijinal sinyalleri yeni koordinat alanına dönüştürüyorum ve ileri seçim en iyi özelliklerini kullanıyorum .kkk Sezgim, PCA'nın, sonuçları …




2
Medyanlar arasındaki farkın% 95'lik bir güven aralığı nasıl oluşturulur?
Benim sorunum: Paralel grup, primer sonucun çok doğru eğriltilmiş dağılımına sahip, randomize bir deneme. Normalliği varsaymak ve normal% 95 CI'leri kullanmak istemiyorum (yani 1.96 X SE kullanarak). Ortanca eğilim ölçüsünü ortanca olarak ifade etmekte rahatım, ancak sorum o zaman iki grup arasındaki medyanlardaki farkın% 95'ini nasıl oluşturacağımı soruyorum. Akla gelen …

3
Yayınlanan p değerlerinin p <.05'teki dağılımındaki süreksizlik nedir?
Son bir makalede , Masicampo ve Lalande (ML) birçok farklı çalışmada yayınlanmış çok sayıda p değeri topladı. P-değerlerinin histogramında% 5 kanonik kritik seviyede meraklı bir sıçrama gözlemlediler. Wasserman'in blogunda bu ML Phenomena hakkında güzel bir tartışma var: http://normaldeviate.wordpress.com/2012/08/16/p-values-gone-wild-and-multiscale-madness/ Blogunda histogramı bulacaksınız: % 5 seviyesi bir sözleşme ve bir doğa yasası …

5
Biyoloji, psikoloji ve tıp alanında uzman kullanan karma model analizi için örnek raporlar?
Genel görüş birliği lmer(), klasik ANOVA yerine R üzerinden karışık modeller kullanmak gibi göründüğü için (genellikle belirtilen nedenlerden dolayı, dengesiz tasarımlar, rastgele çapraz efektler vb.), Verilerimi denemek istiyorum. Ancak bu yaklaşımı süpervizörüme (nihayetinde p-değeri olan klasik bir analiz bekliyor) veya daha sonra hakemlere “satabileceğim” için endişeleniyorum. lmer()Tarla biyolojisi, psikoloji, tıp …


1
Bir modelden terim düştükten sonra uygun kalan serbestlik dereceleri
Bu sorunun etrafındaki tartışmaya ve özellikle Frank Harrell'in yorumuna, indirgenmiş bir modelde (yani, birkaç açıklayıcı değişkenin test edildiği ve reddedildiği bir varyans tahmininin) Ye'in Genelleştirilmiş Serbestlik Dereceleri kullanması gerektiği yorumunu yansıtıyorum . Profesör Harrell, bunun orijinal "tam" modelin (serbest bırakma modelinin) kalan serbestlik derecelerine (bir dizi değişkenin reddedildiği) son bir …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.