Referans istek: Çalışan veri bilimcileri için klasik istatistikler


10

Regresyon, diğer makine öğrenimi tipi algoritmaları ve programlama (hem veri analizi hem de genel yazılım geliştirme için) konusunda sağlam deneyime sahip çalışan bir veri bilimciyim. Çalışma hayatımın çoğu tahmin doğruluğu için modeller (çeşitli iş kısıtlamaları altında çalışmak) ve kendi (ve diğerlerinin) çalışmalarımı desteklemek için veri boru hatları oluşturmaya odaklanmıştı.

İstatistikte resmi bir eğitimim yok, üniversite eğitimim saf matematiğe odaklandı. Bu nedenle klasik konuların birçoğunu, özellikle çeşitli popüler hipotez testlerini ve çıkarımsal teknikleri öğrenmeyi kaçırmıştır.

Bu konular için geçmişim ve deneyim düzeyime sahip biri için uygun olabilecek referanslar var mı? Matematiksel titizliği işleyebilir (ve takdir edebilirim) ve ayrıca algoritmik bakış açılarının tadını çıkarabilirim. Hem matematiksel hem de (veya) programlama odağı ile okuyucuya yönelik alıştırmalar sunan referansları sevme eğilimindeyim.


2
Bir matematik geçmişinden başka bir Matt olarak, boşluklarla dolu istatistik bilgisi ile ilişki kurabilirim! İlgilendiğiniz belirli alanlar / uygulamalar var mı? Klasik istatistiklerle dikkat edilmesi gereken bir şey, varsayımların kullanıldığı şeydir.
GeoMatt22

Yanıtlar:


3

Larry Wasserman'ın Tüm İstatistikleri matematiksel istatistiklerin kasırga turu için güzel bir kitap. Kendimi kullandığım matematiksel istatistiklerle ilgili ilk kitaptı. Hipotez testi ve maksimum olabilirlik tahmini gibi klasikleri içerir, ancak aynı zamanda daha yeni geliştirilen ancak önyükleme gibi eşit derecede önemli konuları da içerir. Wasserman'ın her zaman istatistikte bir ayağı ve makine öğreniminde diğer ayağı vardır, bence tüm çağdaş veri analistlerinin yapması gerekir; Eğer ikisinin sadece bir alanına aşina iseniz, çok şey kaçırırsınız. Ayrıca, kitapta çok iyi alıştırmalar var.

Gerçek analizde bir geçmişiniz varsa ve olasılık ve istatistiklerin ölçü-teorik olarak ele alındığı ham, kesilmemiş şeyleri istiyorsanız, Mark J. Schervish'in İstatistik Teorisini deneyin . Schervish, DeGroot ve Schervish'in yarısıdır, Olasılık ve İstatistik daha az teknik kitabı bugün matematiksel istatistiklerle ilgili en popüler kitaptır. İstatistik Teorisi, genellikle tüm işi kendileri yapması gereken lisansüstü öğrenciler için ayrılmış bir konu için yararlı bir konuşmadır. Dürüst olmak gerekirse, bu kitabı çok zor buldum (Jun Shao'nun Matematik İstatistikleri kadar zor olmasa da)) ve sonunda uzmanlaşmak için gereken yoğun çabayı, uygulamalı bir veri analisti olarak zamanımın iyi bir şekilde kullanılmadığını hissetmeye başladı. Ama yine de çok şey öğrendim ve olasılık teorisinin ne kadar geleneksel yaklaşımında ortaya çıkan kıllı teorik zorlukları temizlemek için ölçü teorisinin ne olduğunu ve nasıl kullanılabileceğini iyi anladım. Ayrıca, değiştirilebilirlik ve bağımsızlığın benzerlik ve farklılıklarını daha iyi takdir etmeye başladım.


2

Kodiolog'un çok iyi önerilerinin yanı sıra (+1) Gözlemsel çalışmaların konusuna da bakmanızı tavsiye ederim . Bence, çoğu durumda analiz edilen verilerin gözlemsel nitelikte olmasına rağmen, veri-bilim adamları arasında çok görülmemiş bir alan olduğunu düşünüyorum. Bence bunun nedeni, bibliyografyanın büyük çoğunluğunun (özellikle Biyoistatistikte) en azından bazı yarı deneysel tasarımların zaten var olduğunu varsaymasıdır. Paul Rosenbaum'un Gözlemsel Araştırmalar ve Gözlemsel Araştırmaların Tasarımı kitapları en sık kullanılan referanslardan bazılarıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.