İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

2
Çok seviyeli bir modelde, tahmin etmeme ve rastlantısal etki korelasyon parametrelerini tahmin etmenin pratik sonuçları nelerdir?
Çok seviyeli bir modelde, tahmin etmeme ve rastlantısal etki korelasyonu parametrelerini tahmin etmenin pratik ve yorumlama ile ilgili etkileri nelerdir? Bunu sormanın pratik nedeni, R'deki lmer çerçevede, parametreler arasındaki korelasyon modelinde tahminler yapıldığında, MCMC teknikleri ile p-değerleri tahmin etmek için uygulanan bir yöntem bulunmamasıdır. Örneğin, bu örneğe bakıldığında (aşağıda alıntı …

4
R'de görsel olarak çekici yoğunluklu ısı haritaları oluşturma
R'de ısı haritaları oluşturmak için bir dizi fonksiyon olduğunu bilmeme rağmen, sorun görsel olarak çekici haritalar üretemem. Örneğin, aşağıdaki resimlerden kaçınmak istediğim iyi ısı haritaları örnekleri. Birincisi açıkça ayrıntıdan yoksun, diğeri (aynı noktalara dayanarak) faydalı olamayacak kadar ayrıntılı. Her iki grafik de spatstat R paketindeki density () işleviyle oluşturulmuştur . …


2
Boş ve alternatif hipotezler ayrıntılı olmalı mı yoksa olmasın mı?
Çok yorucu olduklarını iddia ettiklerini (bu tür kitaplardaki örnekler her zaman olduğu gibi ayarlandılar, gerçekten de öyle olduklarını) çok fazla gördüm, öte yandan da kitapların özel olması gerektiğini belirten birçok kez gördüm ( örnek için olarak ve olarak ) ayrıntılı sorunu açıklık yoktur. Sadece bu soruyu yazmadan önce Wikipedia sayfasında …

3
Hangi hastane seçilmeli? Biri daha yüksek başarı oranına sahipken, diğeri daha yüksek toplam başarı oranına sahip
İstatistik öğretmenimin aşağıdaki sorun hakkında söylediği bir şey hakkında bir sorum var. Benim sorum, bu durumda Simpson'un paradoksunun oluşması hakkında bile değil. Benim sorum basitçe profesörümün A) ve D) 'nin A) ve F) yerine doğru cevaplar olduğu ısrarıyla ilgili. Dedi ki: “E Tipi ameliyatlarda başarı oranı çok düşük olduğu için …

4
Eğitim aşaması ile değerlendirme aşaması arasında neden bir asimetri var?
Özellikle doğal dil işlemede, makine öğreniminin iki adımda, bir eğitim adımında ve bir değerlendirme adımında ilerlemesi ve farklı veriler kullanması gerektiği iyi bilinir. Bu neden? Sezgisel olarak, bu işlem verilerin fazladan yüklenmesini önlemeye yardımcı olur, ancak durumun (bilgi-teorik) nedenini göremiyorum. Buna göre, sırasıyla 2/3 ve 1/3 gibi bir veri setinin …

12
Değer akışı için temel istatistikleri hesaplamak için komut satırı aracı [kapalı]
Standart girdiden sayı akışını (ascii formatında) kabul eden ve bu akış için min, max, ortalama, ortanca, RMS, quantiles vb. Gibi temel tanımlayıcı istatistikleri veren herhangi bir komut satırı aracı var mı? Çıktı, komut satırı zincirindeki bir sonraki komut tarafından ayrıştırılabilir. Çalışma ortamı Linux, ancak diğer seçenekler açıktır.

3
Neden Jeffreys öncelikleri bilgisizdir?
Öncesinde Jeffreys düşünün nereye , nerede Fisher bilgidir.benp ( θ ) ∝ | i ( θ ) |----√p(θ)∝|i(θ)|p(\theta) \propto \sqrt{|i(\theta)|}benii Bunu daha önce bilgilendirici olmayan bir öncelik olarak bahsettiğimi görmeye devam ediyorum, ancak neden bilgilendirici olmadığı konusunda bir tartışma görmedim. Sonuçta, sabit bir öncelik değil, bu yüzden başka bir argüman …
27 bayesian  prior 

1
Çapraz doğrulama, doğrulama kümesi için uygun bir alternatif midir?
Metin sınıflandırmasında yaklaşık 800 örnekli bir eğitim setim ve yaklaşık 150 örnekli bir test setim var. Test seti hiç kullanılmamış ve sonuna kadar kullanılmayı bekliyor. Sınıflayıcıları ve özellikleri ayarlarken ve ayarlarken 10 kat çapraz doğrulama ile tüm 800 örnek eğitim setini kullanıyorum. Bu, ayrı bir doğrulama setine sahip olmadığım anlamına …


4
CART kullanırken “değişken önemi” nasıl ölçülür / derecelendirilir? (özellikle R'den {rpart} kullanarak)
Rpart (R) kullanarak bir CART modeli (özellikle sınıflandırma ağacı) oluştururken, modele tanıtılan çeşitli değişkenlerin önemini bilmek genellikle ilginçtir. Dolayısıyla benim sorum şu: Bir CART modelinde katılımcı değişkenlerin değişken önem derecesini sıralamak / ölçmek için hangi ortak önlemler var? Ve bu nasıl R kullanılarak hesaplanabilir (örneğin, rpart paketini kullanırken) Mesela, işte …

3
R sembolik hesaplama?
R'de sembolik hesaplama yapmanın mümkün olup olmadığını merak ediyordum. Örneğin, 3D Gauss dağılımının sembolik bir kovaryans matrisinin tersini almayı umuyordum. Ayrıca R'de sembolik bütünleşme ve farklılaşma yapabilir miyim?
27 r 

2
Regresyonda p-değerlerinin anlamı
Bazı yazılım paketlerinde (örneğin Mathematica) doğrusal bir regresyon gerçekleştirdiğimde, modeldeki bireysel parametrelerle ilişkili p-değerleri alıyorum. Örneğin, sonucunu üreten bir doğrusal regresyonun sonuçları, a ve bir ile b ile ax+bax+bax+bilişkili bir p değerine sahip olacaktır .aaabbb Bu p değerleri bu parametreler hakkında bireysel olarak ne anlama geliyor? Herhangi bir regresyon modeli …

3
AIC farklı model tipleri arasında karşılaştırma yapabilir mi?
Doğrusal olmayan modelleri R'de karşılaştırmak için AIC'yi (Akaike'ın Bilgi Ölçütü) kullanıyorum. Farklı model türlerinin AIC'lerini karşılaştırmak geçerli midir? Spesifik olarak, glm ile takılmış bir modeli karşılaştırırken, glmer (lme4) tarafından takılan rastgele etki terimine sahip bir modeli karşılaştırıyorum. Olmazsa, böyle bir karşılaştırma yapmanın bir yolu var mı? Yoksa fikir tamamen geçersiz …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.