Veri analizini öğrenmeye devam etmek için düzenli zaman yatırımı yapabileceğimi sanmıyorum
Casella & Berger'in veri analizi konusunda veriyi öğrenebileceği bir yer olduğunu sanmıyorum . İstatistik teorisinin bazı araçlarını öğrenmek için bir yer.
Şimdiye kadar bir istatistikçi olmamı söyleyen deneyimim, çeşitli dağılımları içeren çok sıkıcı hesaplamalara dayanmak zorunda (Weibull, Cauchy, t, F ...).
Veri analizi yapan bir istatistikçi olarak çok zaman geçirdim. Nadiren (neredeyse hiç) sıkıcı bir hesaplama yapmamı gerektirir. Bazen biraz basit cebir içerir, ancak ortak problemler genellikle çözülür ve bunu her seferinde tekrarlamak için herhangi bir çaba harcamam gerekmez.
Bilgisayar tüm sıkıcı hesaplamaları yapar.
Makul bir şekilde standart bir durum üstlenmeye hazır olmadığım (örneğin bir GLM kullanmaya hazırlıklı olmadığım) bir durumdaysam, genel olarak başka bir dağıtımı da üstlenecek kadar bilgiye sahip değilim, bu yüzden LRT genellikle moot (ihtiyaç duyduğum zaman yapabilirim, ya çoktan çözülmeye ya da nadiren ilginç bir saptırma ortaya çıkmaya meyillidirler).
Çok fazla simülasyon yapmaya meyilliyim; Ben de sıklıkla yeniden örneklemeyi parametrik varsayımların yanında ya da onun yerine bir biçimde kullanmayı deniyorum.
Eskiden yaptığım gibi haftada 20 saat + harcamam gerekecek mi?
Bu, ne yapabilmek istediğinize ve bu konuda ne kadar çabuk iyileşmek istediğinize bağlıdır.
Veri analizi bir beceridir ve pratik ve geniş bir bilgi tabanı gerektirir. Zaten ihtiyacınız olan bazı bilgilere sahip olacaksınız.
Eğer çok çeşitli konularda iyi bir uygulayıcı olmak istiyorsanız, çok zaman alacaktır - ama bence cebirden ve Casella ve Berger egzersizlerini yapmaktan çok daha eğlenceli.
Oluşturduğum becerilerin bir kısmı, regresyon problemlerinin zaman serileri için faydalı olduğunu söylüyor, yani - çok fazla yeni beceriye ihtiyaç var. Bu yüzden artık arsaları ve QQ arsalarını yorumlamayı öğrenmek faydalıdır, ancak bana bir PACF arsadaki küçük bir çarpma konusunda ne kadar endişelenmem gerektiğini söylemiyorlar ve bana bir adım ileriye dönük tahminin kullanımı gibi araçlar vermiyorlar. hatalar.
Örneğin, tipik gamma veya weibull modelleri için makul bir şekilde ML'nin nasıl yapılacağını bulmak için çaba harcamam gerekmiyor , çünkü zaten büyük ölçüde uygun bir forma getirilen sorunları çözebilecek kadar standartlar.
Araştırma yapmaya gelirseniz , Casella & Berger gibi yerlerde edindiğiniz becerilerden daha fazlasına ihtiyacınız olacak (ancak bu tür becerilerde bile birden fazla kitap okumalısınız).
Bazı önerilen şeyler:
Başka hiçbir şey yapmasanız bile, kesinlikle bazı regresyon becerileri geliştirmelisiniz.
Çok sayıda iyi kitap var, ama belki de Draper ve Smith Uygulamalı Regresyon Analizi artı Fox ve Weisberg Uygulamalı Regresyona Bir Arkadaş ; Ayrıca Harrell Regresyon Modelleme Stratejileri'ni izlemenizi öneririz.
(Draper ve Smith yerine istediğiniz sayıda iyi kitap kullanabilirsiniz - size uygun bir veya iki tane bulabilirsiniz.)
İkinci kitabın, okumaya değer çok sayıda çevrimiçi ek bölümleri var (ve kendi R-paketini)
-
İyi bir ikinci porsiyon Venables & Ripley's S ile Modern Uygulamalı İstatistikler olacaktır .
Bu, fikirlerin oldukça geniş bir yelpazesinde topraklanmadır.
Bazı konularda daha temel malzemelere ihtiyaç duyduğunuz ortaya çıkabilir (geçmişinizi bilmiyorum).
O zaman hangi istatistik alanlarını istediğinizi / ihtiyaç duyduğunuzu düşünmeye başlamanız gerekir - Bayesian istatistikleri, zaman serileri, çok değişkenli analiz, vb.