İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

16
Normallik testi 'esasen işe yaramaz mı'?
Eski bir meslektaşım bir keresinde bana şöyle tartışmıştı: Normalde, null altında sadece asimptotik veya neredeyse normal olan rastgele değişkenler üreten (nihayetinde büyük yapamayacağımız miktarlara bağlı 'asimptotik' kısmı olan) süreçlerin sonuçlarına normalite testleri uygularız ; Ucuz bellek, büyük veri ve hızlı işlemciler çağında, normallik testleri, büyük (delicesine büyük olmasa da) örnekler …

7
Çoklu regresyon yaparken, yordayıcı değişkenlerinizi ne zaman merkezlemelisiniz ve ne zaman standartlaştırmalısınız?
Bazı literatürde, eğer farklı birimlerde standartlaştırılmışsa, birden fazla açıklayıcı değişkenli bir regresyonun okudum. (Standartlaştırma ortalamanın çıkarılması ve standart sapmanın bölünmesine dayanır.) Verilerimi başka hangi durumlarda standartlaştırmam gerekir? Verilerimi yalnızca ortalamam gereken durumlar var mı (yani standart sapmalara bölünmeden)?



11
Serbestlik dereceleri nasıl anlaşılır?
Gönderen Vikipedi , bir istatistik serbestlik derecesi üç yorumlar vardır: İstatistiklerde, serbestlik derecelerinin sayısı, değişmeden serbest olan bir istatistiğin son hesaplamasındaki değerlerin sayısıdır . İstatistiksel parametrelerin tahminleri, farklı miktarlarda bilgi veya verilere dayanabilir. Bir parametrenin tahminine giren bağımsız bilgi sayısına serbestlik derecesi (df) denir. Genel olarak, bir parametrenin bir tahmini …


16
İstatistiksel testlerde p değerleri ve t değerlerinin anlamı nedir?
Bir istatistik kursu aldıktan ve diğer öğrencilere yardım etmeye çalıştıktan sonra, çok fazla kafa yordamı uyandırmaya ilham veren bir konuyu istatistiksel hipotez testlerinin sonuçlarını yorumlamakta olduğunu fark ettim. Öğrencilerin, belirli bir test için gereken hesaplamaları nasıl yapabileceklerini kolayca öğrendikleri, ancak sonuçları yorumlamada takıldıkları anlaşılmaktadır. Birçok bilgisayarlı araç test sonuçlarını "p …




2
R'nin lm () çıktısının yorumlanması
R’deki yardım sayfaları, bu sayıların ne anlama geldiğini bildiğimi varsayıyor ama bilmiyorum. Buradaki her sayıyı sezgisel olarak anlamaya çalışıyorum. Çıktısını göndereceğim ve ne bulduğuma dair yorum yapacağım. Varsayıp yazacağım gibi hatalar olabilir (irade). Temel olarak katsayılardaki t-değerinin ne anlama geldiğini ve neden artık standart hatayı yazdırdıklarını bilmek istiyorum. Call: lm(formula …

6
yararlı mı yoksa tehlikeli mi?
İçinden Aşırıyordu bir Özetler (özellikle, Bölüm 2.1.1'de Cosma Shalizi ile ikinci ders ) ve çok düşük alabilirsiniz hatırlatılarak , bir tam olarak doğrusal olmadığı zaman bile.R2R2R^2 Shalizi örneğini aktaracak olursak: Eğer bir modeli olduğunu varsayalım , bilinir. Sonra ve açıklanan varyans miktarı bir ^ 2 \ Var [X] , böylece …



12
Neden bir% 95 Güven Aralığı (CI) ortalamayı içeren bir% 95 şans anlamına gelmiyor?
Buradaki çeşitli ilgili sorularla, "% 95 güven aralığı" dediğimiz şeyin "% 95" bölümünün, örnekleme ve CI-hesaplama prosedürlerimizi birçok kez tam olarak çoğaltacak olmamız gerektiği anlamına geldiği konusunda fikir birliği olduğu anlaşılıyor. Bu şekilde hesaplanan CI'lerin% 95'i popülasyon ortalamasını içerecektir. Ayrıca, bu tanımın yapmaması konusunda fikir birliği var gibitek bir% 95 …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.