İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

8
İstatistiksel Öğrenme Unsurlarından Önce Okumak için Kitap?
Bu yazıya dayanarak, İstatistiksel Öğrenmenin Öğelerini sindirmek istiyorum. Neyse ki ücretsiz olarak kullanılabilir ve okumaya başladım. Bunu anlayacak kadar bilgim yok. Kitaptaki konulara daha iyi bir giriş niteliğinde olan bir kitap önerebilir misiniz? Umarım bana anlamak için gereken bilgiyi verecek bir şey? İlgili: Matematikte güçlü bir geçmiş ML için toplam …

6
Aynı anda R kullanarak istatistik öğrenmeye başlamak için hangi kitap önerilir?
R kullanarak İstatistik Öğrenmek Kitaplar Tam olarak aradığım kitap nedir? Aradığım şey, size uygulamalı deneyim sunmak ve böylece R'yi birlikte öğrenmenize yardımcı olmak için R'yi kullanırken istatistiklerini öğreten bir kitap. Amazon'da bunu yapmaya çalışan pek çok kitap gördüm, ancak R ile değil. Örnekler Minitab ve SAS. R Book ve Statistics …
50 r  references 

5
Nüfus varyansını hesaplamada N ve N-1 arasındaki fark nedir?
Neden olduğunu Nve N-1popülasyon varyansını hesaplarken anlamadım . Ne zaman Nve ne zaman kullanıyoruz N-1? Daha büyük bir sürüm için buraya tıklayın Nüfusun çok büyük olması durumunda N ve N-1 arasında bir fark olmadığını ancak başlangıçta neden N-1 olduğunu söylemediğini söylüyor. Düzenleme: Lütfen tahmin etmekte kullanılan nve kime karıştırmayın n-1. …


3
'Tekrarlanabilir araştırmayı' nasıl tanımlarız?
Bu şimdi birkaç soruda ortaya çıktı ve bir şey hakkında merak ediyorum. Bir bütün olarak alan, orijinal verilerin ve söz konusu kodun kullanılabilirliğine odaklanarak "tekrarlanabilirliğe" doğru yöneldi mi? Her zaman, yeniden üretilebilirliğin özünün zorunlu olduğunu söylemem gerektiği gibi, Çalıştır'ı tıklayıp aynı sonuçları elde etme kabiliyetine sahip olduğum öğretildi. Veri ve …

5
“P-değeri” nin doğru yazımı (büyük harf, italikleştirme, heceleme)?
Bunun bilgiçlik ve titizlik olduğunun farkındayım, ancak istatistiklerin dışında bir alanda, araştırmacıların istatistik alanında sınırlı bir örgün eğitimi olan bir araştırmacı olarak, "p-değerini" doğru yazıp yazamadığımı her zaman merak ediyorum. özellikle: "P" nin büyük harfle yazılması mı gerekiyor? "P" nin italikleştirilmesi mi gerekiyor? (Veya matematiksel fontta, TeX'te?) "P" ve "value" …

6
Sırt regresyonu yüksek boyutlarda işe yaramaz mı (
İle iyi eski regresyon problemi düşünün belirleyicileri ve örnek büyüklüğü . Her zamanki bilgelik, OLS tahmincisinin fazladan donacağı ve genel olarak ridge regresyon tahmincisi tarafından daha iyi şekillendirileceğidir:Optimal düzenlileştirme parametresi bulmak için çapraz doğrulama kullanmak standarttır . Burada 10 kat CV kullanıyorum. Açıklama güncellemesi: olduğunda "OLS tahmincisi" tarafından tarafından verilen …


3
K-Means ve EM ile Kümelenme: Bunlar nasıl ilişkilidir?
Verileri kümelemek için algoritmalar çalıştım (denetimsiz öğrenme): EM ve k-araçları. Aşağıdakileri okumaya devam ediyorum: k-aracı, kümelerin küresel olduğu varsayımlarıyla birlikte EM'nin bir çeşididir. Birisi yukarıdaki cümleyi açıklayabilir mi? Küresel olanın ne anlama geldiğini ve kmeans ve EM'in birbirleriyle nasıl ilişkili olduğunu anlamıyorum, çünkü biri olasılıksal ödevini diğeri ise deterministik bir …

3
SVD'nin ardındaki sezgi nedir?
Tekil değer ayrışımı (SVD) hakkında okudum. Neredeyse tüm ders kitaplarında, verilen spesifikasyon ile matrisi üç matrise dönüştürdüğü belirtilmektedir. Fakat matrisi böylesi bir biçimde bölmenin ardındaki sezgi nedir? PCA ve boyutsallığı azaltmaya yönelik diğer algoritmalar, algoritmanın güzel görselleştirme özelliğine sahip olduğu anlamında sezgiseldir ancak SVD'de durum böyle değildir.

2
Çoklu regresyonda 'kontrol etme' ile diğer değişkenleri yoksayma arasında bir fark var mı?
Açıklayıcı bir değişkenin çoklu regresyondaki katsayısı bize, açıklayıcı değişkenin bağımlı değişkenle ilişkisini gösterir. Bütün bunlar diğer açıklayıcı değişkenleri kontrol ederken. Şimdiye kadar nasıl izledim: Her katsayı hesaplanırken, diğer değişkenler dikkate alınmaz, bu yüzden göz ardı edilmelerini düşünüyorum. Öyleyse, “kontrollü” ve “yok sayılan” terimlerinin birbirinin yerine kullanılabileceğini düşündüğümde haklı mıyım?

1
Lojistik bir regresyon modeli uyumundan tahmin edilen değerlerin (Y = 1 veya 0) elde edilmesi
Diyelim ki bir sınıf nesnesine sahibim glm(bir lojistik regresyon modeline karşılık gelir) ve predict.glmargümanı kullanarak verilen öngörülen olasılıkları type="response"ikili yanıtlara, yani veya Y = 0'a çevirmek istiyorum . R'de bunu yapmanın en hızlı ve en kanonik yolu nedir?Y=1Y=1Y=1Y=0Y=0Y=0 Yine, ben farkındayım ederken predict.glm, ben kesme değeri tam olarak nerede bilmiyorum …

4
SVM'yi takarken neden ikili problemle uğraşıyorsunuz?
Veri noktaları göz önüne alındığında ve etiketler y 1 , ... , Y , n ∈ { - 1 , 1 } , sert kenar SVM asli bir sorundurx1,…,xn∈Rdx1,…,xn∈Rdx_1, \ldots, x_n \in \mathbb{R}^dy1,…,yn∈{−1,1}y1,…,yn∈{−1,1}y_1, \ldots, y_n \in \left \{-1, 1 \right\} s.t.minimizew,w012wTwminimizew,w012wTw \text{minimize}_{w, w_0} \quad \frac{1}{2} w^T w s.t.∀i:yi(wTxi+w0)≥1s.t.∀i:yi(wTxi+w0)≥1 \text{s.t.} \quad …
50 svm 

16
Deneme tasarımı üzerine önerilen kitaplar?
Panelin deney tasarımı üzerine kitaplar için önerileri nelerdir? İdeal olarak, kitaplar her zaman mümkün olmamakla birlikte, hala basılı olarak veya elektronik ortamda erişilebilir olmalıdır. Kitapla ilgili neyin iyi olduğuna dair birkaç kelime eklemek için harekete geçerseniz, bu da harika olurdu. Ayrıca, cevap başına bir kitap hedefleyin ki oylama önerileri sıralamaya …

4
ANOVA neden doğrusal regresyona eşittir?
ANOVA ve lineer regresyonun aynı olduğunu okudum. Bu, ANOVA çıktısının, bir değeri ve farklı numuneler boyunca numune anlamına gelirse, aynı veya farklı olup olmadığına karar verdiğiniz bir değeri olduğunu göz önünde bulundurarak olabilir .FFFppp Ancak, araçların eşit olmadığını varsayalım (boş hipotezi reddet), ANOVA size doğrusal modelin katsayıları hakkında hiçbir şey …
50 regression  anova 

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.