İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

2
“Iris” veri setinin hangi yönleri onu örnek / öğretim / test veri seti olarak başarılı kılmıştır?
"İris" veri kümesi muhtemelen burada çoğu insan için tanıdık - kanonik test veri setlerinin bir ve veri görselleştirme gelen makine öğrenmeye her şey için bir örnek go-veri kümesi bulunuyor. Örneğin, bu sorudaki herkes tedaviyle ayrılmış saçılma noktalarının tartışılması için kullandı. Ne yapar İris veri yüzden kullanışlı set? Sadece orada ilk …
28 dataset 

7
Çevirilerin sayısı arttıkça neden kuyruklarla aynı sayıda kafa çevirme olasılığınızın düşük olduğunu açıklamak için İstatistik kavramı?
Birkaç kitap okuyarak ve bazı kodlar yazarak olasılık ve istatistik öğrenmeye çalışıyorum ve yazı turalarını simüle ederken birisinin saf sezgisine biraz karşı geldiğimde beni vuran bir şey fark ettim. Eğer adil bir yazı tura durumunda nnn defa, 1 olarak doğru kuyrukları yakınsak için kafaların oranını nnn arttıkça, tam olarak beklediğiniz …

7
Önceki madeni para basmalarının sonuçlarının, sonraki madeni para basmalarına ilişkin inançları etkilediği istatistiksel yanlışlığın adı nedir?
Hepimizin bildiği gibi, kuyruklarla aynı derecede iniş şansı olan bir madeni parayı çevirirseniz, o zaman madeni parayı birçok kez çevirirseniz, yarısı kafa alırsınız ve yarısı kuyruk alırsınız. Bunu bir arkadaşınızla tartışırken, madeni parayı 1000 kez çevirirseniz ve ilk 100 kez kafa attığını söyleseniz, kuyruğun iniş yapma şansının arttığını söylerlerdi (mantık …

1
Kesilmiş dağıtım için maksimum olasılık tahmin edicileri
Düşünün bağımsız örnekler rastgele değişken elde edilen (örneğin, bir kesik bir dağılımı gösterdiği kabul edilmektedir normal dağılım kesildi bilinen (sonlu) minimum ve maksimum değerler için) ve ancak bilinmeyen parametreler arasında ve . Eğer kesik olmayan bir dağılım , ve için ve en yüksek olabilirlik tahmin edicileri ortalamaNNNSSSXXXaaabbbμμ\muσ2σ2\sigma^2XXXμˆμ^\widehat\muσˆ2σ^2\widehat\sigma^2μμ\muσ2σ2\sigma^2SSSμˆ=1N∑iSiμ^=1N∑iSi\widehat\mu = \frac{1}{N} \sum_i …



7
Neden ve ne zaman bir R paketi yaratmalı?
Bu sorunun oldukça geniş bir soru olduğunu anlıyorum, ancak R için yeni bir paket oluşturmaya (ya da vermeme) karar vermede belirleyici noktaların ne olması gerektiğini merak ediyorum. Daha açık olmak gerekirse, sorunun nedenlerle ilgili olmadığını da ekleyeceğim. Çeşitli komut dosyalarını derleme ve bunları yeni bir pakete entegre etme kararı hakkında …
28 r  software 

5
Denklemlerden daha fazla görüntü kullanmayı açıklayan bir istatistik kitabı
İstatistiklerle ilgilenmeye başladım, ancak matematiği ciddiye aldığımdan bu yana uzun zaman geçtiğini itiraf etmeliyim. Bazen denklemlerin ne anlama geldiğini anlıyorum ama bazen onları takip edemiyorum. Görüntüyü bir okla kullanan burada verilen cevabı seviyorum: Kök ortalama kare hatasının kavramsal sapması ve ortalama sapma sapması . Denklemlerden daha fazla rakamlar kullanan modelleme, …
28 references 

3
Gauss Oranı Dağılımı:
İki bağımsız normal dağılım ve ile çalışıyorum, ve ve variances veXXXYYYμxμx\mu_xμyμy\mu_yσ2xσx2\sigma^2_xσ2yσy2\sigma^2_y . oranlarının dağılımı ile ilgileniyorum . Ne ne de ortalamaları sıfır, yaniZ=X/YZ=X/YZ=X/YXXXYYYZZZ , Cauchy olarak dağıtılmaz. μ x , μ y , σ 2 x ve σ 2 y CDF'sini bulmam gerekiyorZZZ ve ardından saygı ile CDF'nin türev almakμxμx\mu_xμyμy\mu_yσ2xσx2\sigma^2_xσ2yσy2\sigma^2_y …

3
Ya rastgele numaranız açıkça temsili değilse?
Ne rastgele bir örnek alırsanız ve son bir soruda olduğu gibi açıkça temsili olmadığını görebilirsiniz . Örneğin, popülasyon dağılımının 0 civarında simetrik olması gerekiyorsa ve rastgele çizdiğiniz örnek dengesiz pozitif ve negatif gözlemlere sahipse ve dengesizlik istatistiksel olarak önemliyse, sizi nereye bırakır? Önyargılı bir örneği temel alan nüfus hakkında ne …

1
Karışık etkiler modelinde rastgele etkilerin varyansı ve korelasyonu nasıl yorumlanır?
Umarım hepiniz bu soruyu umursamazsınız, ancak R'de öğrenmeye çalıştığım doğrusal karışık efektler model çıktısı için çıktı yorumlamada yardıma ihtiyacım var. Boyuna veri analizi ve doğrusal karışık etkiler regresyonunda yeniyim. Zaman öngörücüsü olarak haftalarla donattığım bir modelim var ve sonuç olarak da bir iş bulma kursum var. Haftaları (zamanları) ve çeşitli …


5
Yaygın dağılımların gerçek hayattan örnekleri
İstatistiğe ilgi duyan yüksek lisans öğrencisiyim. Maddeyi genel olarak seviyorum, ancak bazen gerçek hayata uygulamalar hakkında düşünmekte zorlanıyorum. Özellikle, benim sorum yaygın olarak kullanılan istatistiksel dağılımlar (normal - beta-gamma vb.) İle ilgili. Sanırım bazı durumlarda, dağıtımı oldukça iyi yapan belirli özellikleri elde ediyorum - örneğin üstel ve hafızasız özellik. Ancak …

4
Öğretilen bir eğitime karşı kendi kendine çalışma?
Programcılarda da benzer amaçlara sahip bir soru var . Bu sorunun oldukça iyi cevapları var, ancak genel tema, kendi kendine çalışma olmadan, hiçbir yerde olmamanız gibi görünüyor. Açıkçası, programlama ve istatistik arasında bazı büyük farklar var - programlamada, gerçekten sadece bazı temel mantıkları öğreniyor ve ardından tekrar tekrar uyguluyorsunuz. Yeni …

7
Keyfi bir kesikli dağılıma göre sayılar nasıl oluşturulur?
Rasgele kesikli dağılıma dayalı sayıları nasıl oluştururum? Örneğin, oluşturmak istediğim bir dizi numara var. Diyelim ki 1-3 ile etiketlenmişler. % 1: 4,% 2: 50,% 3: 46 Temel olarak, yüzdeler, rasgele sayı üretecinin çıktısında görünecekleri olasılıktır. [0, 1] aralığında tekdüze bir dağılım oluşturacak bir pesudorandom sayı üreteci var. Bunu yapmanın bir …

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.