İstatistikler ve Büyük Veri

İstatistik, makine öğrenmesi, veri analizi, veri madenciliği ve veri görselleştirmesi ile ilgilenen kişiler için soru cevap

27
Uyuyan Güzel Paradoks
Durum Bazı araştırmacılar sizi uyutmak istiyor. Adil bir madalyonun sırrına bağlı olarak, sizi bir kez (Başlar) veya iki kez (Kuyruklar) kısaca uyandırırlar. Her uyandıktan sonra, sizi uyandırdığınızı unutan bir ilaçla uyumaya başlatacaklar. Eğer uyanmış zaman, ne ölçüde olmalıdır için size yazı-tura sonucu Başkanları olduğuna inanıyoruz? (Tamam, belki de bu deneyin …

8
Newton'un yöntemi neden makine öğrenmesinde yaygın olarak kullanılmıyor?
Bu bir süredir beni rahatsız eden bir şey ve çevrimiçi olarak tatmin edici bir cevap bulamadım, işte burada: Dışbükey optimizasyon üzerine bir dizi dersi inceledikten sonra, Newton'un metodu global olarak en uygun çözümleri bulmak için gradyan inişinden çok daha üstün bir algoritma gibi görünmektedir, çünkü Newton'un metodu çözümü için bir …

4
Cohen'in basit İngilizce dilinde kappa
Bir veri madenciliği kitabı okuyorum ve sınıflayıcıların tahmin performansını değerlendirmenin bir aracı olarak Kappa istatistiklerinden bahsetti. Ancak bunu anlayamıyorum. Ayrıca Wikipedia'yı da kontrol ettim ama bu da yardımcı olmadı: https://en.wikipedia.org/wiki/Cohen's_kappa . Cohen'in kappa sınıflandırıcıların öngörü performansını değerlendirmede nasıl yardımcı olur? Ne anlatıyor? % 100 kappa'nın sınıflandırıcının rastgele bir sınıflandırıcıyla tamamen …



9
Mahalanobis mesafesinin en üstündeki açıklama?
Örüntü tanıma ve istatistik çalışıyorum ve konuyla ilgili açtığım hemen hemen her kitabı Mahalanobis mesafesi kavramına çarpıyorum . Kitaplar bir tür sezgisel açıklamalar veriyor, ama hala neler olduğunu gerçekten anlayabilmem için yeterince iyi değil. Biri bana "Mahalanobis mesafesi nedir?" Diye sorarsa. Sadece cevap verebilirdim: "Bir çeşit mesafeyi ölçen bu güzel …

9
Rastgele bir ormandan bilgi edinmek
Rastgele ormanlar kara kutu olarak kabul edilir, ancak son zamanlarda rastgele bir ormandan hangi bilgilerin elde edilebileceğini düşünüyordum? En belirgin şey değişkenlerin önemidir, en basit değişkende, sadece değişkenlerin oluşum sayısını hesaplayarak yapılabilir. Düşündüğüm ikinci şey etkileşimler. Ağaç sayısı yeterince büyükse, o zaman değişken çiftlerinin oluşum sayısının test edilebildiğini düşünüyorum (ki …

3
Tutarlı bir tahmin edici ile tarafsız bir tahmin edici arasındaki fark nedir?
Bunu gerçekten kimsenin sormamış gibi görünmesine şaşırdım ... Tahmin edicileri tartışırken, sıklıkla kullanılan iki terim "tutarlı" ve "yansız" dır. Sorum basit: fark nedir? Bu terimlerin kesin teknik tanımları oldukça karmaşıktır ve bunların ne için sezgisel bir fikir edinmesini zor demek . İyi bir tahminci ve kötü bir tahminci hayal edebiliyorum, …

3
Bayesian önceki ve posterior dağılımlarını anlamama yardım et
Bir grup öğrencide, solak 18 kişiden 2'si vardır. Öğrenimsiz olduğunu varsayarsak popülasyondaki solak öğrencilerin arka dağılımını bulun. Sonuçları özetle. Literatüre göre insanların% 5-20'si solaktır. Bu bilgileri öncekilerinizde dikkate alın ve yeni posterior hesaplayın. Beta dağılımının burada kullanılması gerektiğini biliyorum . İlk olarak, αα\alpha ve ββ\beta değerleri 1 olarak? Posterior malzemesinde …


6
Sırasız kategorik değişkenlerle korelasyonlar
Birçok gözlem ve değişken içeren bir veri çerçevem ​​var. Bazıları kategoriktir (sıralanmamış), bazıları sayısaldır. Bu değişkenler arasındaki ilişkileri arıyorum. Sayısal değişkenler için korelasyon hesaplayabildim (Spearman korelasyonu) ama: Sırasız kategorik değişkenler arasındaki ilişkiyi nasıl ölçeceğimi bilmiyorum. Sırasız kategorik değişkenler ile sayısal değişkenler arasındaki ilişkiyi nasıl ölçeceğimi bilmiyorum. Bunun nasıl yapılabileceğini bilen …


3
Olasılık uzaylarını tanımlamak için neden sigma-cebirlerine ihtiyacımız var?
Biz var rastgele deney farklı olan sonuçların oluşturan örnek uzay Ω ,Ω,\Omega, denilen biz belli kalıplarını ilgiyle bakmak hangi, olaylar F.F.\mathscr{F}. Sigma-cebirleri (veya sigma-alanları) , bir olasılık ölçüsü PP\mathbb{P} atanabileceği olaylardan oluşur . Boş kümenin ∅∅\varnothing ve tüm örnek uzayının dahil edilmesi ve Venn diyagramlarıyla sendikaları ve kavşakları tanımlayan bir …

21
Sınırlı bir sonsuz işlemin her adımında, bir semaver 10 top koyun ve rastgele birini kaldırın. Kaç tane top kaldı?
Soru (hafifçe değiştirilmiş) aşağıdaki gibi gider ve eğer daha önce hiç karşılaşmadıysanız, Sheldon Ross'un Olasılıkta Bir İlk Kursunun 2. bölümündeki örnek 6a'yı kontrol etmeden önce : Sonsuz derecede büyük bir semire ve 1, 2, 3 ve benzeri numaralı bilyalı etiketli sonsuz bir top koleksiyonuna sahip olduğumuzu varsayalım. Aşağıdaki şekilde gerçekleştirilen …


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.