(Çok) kısa hikaye
Uzun lafın kısası, bir anlamda, istatistikler diğer teknik alanlara benzer: Hızlı bir yol yoktur .
Uzun Hikaye
ABD'deki istatistik diploma programları nispeten nadirdir. Bunun doğru olduğuna inanıyorum, istatistikleri bir lisans müfredatına yerleştirmek için gereken her şeyi toplamanın oldukça zor olduğudur. Bu, özellikle önemli genel eğitim gereksinimi olan üniversitelerde geçerlidir.
Gerekli becerileri geliştirmek (matematiksel, hesaplamalı ve sezgisel) çok çaba ve zaman alır. İstatistikler, öğrenci hesap matematiğine ve makul miktarda lineer ve matris cebirine hakim olduktan sonra oldukça iyi bir "operasyonel" seviyede anlaşılmaya başlanabilir. Bununla birlikte, herhangi bir uygulamalı istatistikçi, bir çerez kesici ya da istatistiklere dayanan tarif tabanlı bir yaklaşıma uymayan bir bölgede kendini bulmanın oldukça kolay olduğunu bilir. Yüzeyin altında neler olup bittiğini gerçekten anlamak için bir önkoşul olarak gerektirirmatematik ve bugünün dünyasında, lisans eğitiminin sonraki yıllarında yalnızca gerçekten elde edilebilecek bilgisayarlı olgunluk. Bu, gerçek istatistik eğitiminin çoğunlukla ABD’de MS düzeyinde başlamasıdır (Hindistan, özel ISI’leri ile biraz farklı bir hikaye. Bazı Kanada merkezli eğitim için benzer bir tartışma yapılabilir. Avrupa veya Rusya merkezli lisans istatistik eğitimine ilişkin bilgi sahibi olmak.)
Neredeyse herhangi bir (ilginç) meslek yüksek lisans düzeyinde bir eğitim gerektirir ve gerçekten ilginç (benim görüşüme göre) işler esas olarak doktora düzeyinde bir eğitim gerektirir.
Matematik alanında doktora yaptığınızı görünce, hangi alanda olduğunu bilmiyor olsak da, yüksek lisans eğitimine daha yakın bir şey için önerilerim. Seçimleri açıklamak için parantez içinde bazı açıklamalar ekliyorum.
- D. Huff, İstatistiklerle Nasıl Yalan Edilir . (Çok hızlı, kolay okunur. Özellikle meslekten olmayanlara istatistik sunarken, kavramsal fikirlerin ve tuzakların çoğunu gösterir.)
- Ruh Hali, Graybill ve Boes, İstatistik Teorisine Giriş , 3. baskı, 1974. (Teorik istatistiklere MS düzeyinde giriş. Klasik, sık çerçeveli bir çerçevede örnekleme dağılımlarını, nokta tahminini ve hipotez testlerini öğreneceksiniz. bunun, Casella & Berger veya Rice gibi modern meslektaşlarından daha iyi ve biraz daha gelişmiş olduğu kanısındayım.)
- Seber & Lee, Doğrusal Regresyon Analizi , 2. baskı. (Uygulamalı istatistiklerde muhtemelen en önemli konu olan lineer modeller için nokta tahmini ve hipotez testinin teorisini ortaya koyar. Muhtemelen iyi bir lineer cebir geçmişine sahip olduğunuzdan, geometrik olarak neler olup bittiğini hemen anlayabilmelisiniz. Çok fazla sezgi sağlar.Ayrıca model seçimindeki değerlendirme sorunları, varsayımlardan sapmalar, tahmin ve doğrusal modellerin sağlam versiyonları hakkında iyi bilgiye sahiptir.)
- Hastie, Tibshirani ve Friedman, İstatistiksel Öğrenmenin Öğeleri , 2. baskı, 2009. (Bu kitap sondan çok daha fazla uygulamalı bir hissi vardır ve geniş bir yelpazede modern makine öğrenme konularını kapsar. Buradaki en büyük katkı istatistiksel yorumların sağlanmasıdır. özellikle bu tür modellerde belirsizliği miktarının içinde amorti birçok makine-öğrenme fikirlerden. Bu un (der) tipik makine-öğrenme kitaplarında ele gitmek. ücretsiz Yasal olarak kullanılabilir eğilimi şeydir burada .)
- A. Agresti, Kategorik Veri Analizi , 2. baskı. (Ayrık verilerle istatistiksel bir çerçevede nasıl başa çıkılacağının iyi sunumu. İyi teori ve iyi pratik örnekler. Belki de bazı açılardan geleneksel tarafta).
- Boyd ve Vandenberghe, Dışbükey Optimizasyon . (En popüler modern istatistiksel tahmin ve hipotez test problemlerinin çoğu dışbükey optimizasyon problemleri olarak formüle edilebilir. Bu, aynı zamanda SVM'ler gibi çok sayıda makine öğrenme tekniğine de yöneliktir. oldukça değerli, sanırım yasal olarak burada mevcut .)
- Efron ve Tibshirani, Önyüklemeye Giriş . (En azından bootstrap ve ilgili tekniklere aşina olmalısınız. Ders kitabı için hızlı ve kolay okunur.)
- J. Liu, Bilimsel Hesaplamada Monte Carlo Stratejileri veya P. Glasserman, Finansal Mühendislikte Monte Carlo Yöntemleri . (Sonuncusu kulağa çok özel bir uygulama alanına yöneliyor, ancak bence en önemli tekniklerin hepsine iyi bir genel bakış ve pratik örnekler vereceğim. .)
- E. Tufte, Nicel Bilginin Görsel Gösterimi . (Verilerin iyi görselleştirilmesi ve sunumu, istatistikçiler tarafından bile [oldukça] önemsenmez.
- J. Tukey, Açıklayıcı Veri Analizi . (Standart. Oldie, ama goodie. Bazıları eski diyebilir, ama yine de bakmaya değer.)
Tamamlayıcılar
İşte size yardımcı olacak, daha biraz daha gelişmiş, teorik ve / veya yardımcı nitelikte olan bazı diğer kitaplar.
- FA Graybill, Lineer Modelin Teorisi ve Uygulaması . (Eski moda, korkunç dizgi, ancak Seber & Lee'nin aynı temelini ve daha fazlasını kapsar. Eski moda diyorum çünkü daha modern tedaviler muhtemelen birçok teknik ve kanıtı birleştirmek ve basitleştirmek için SVD'yi kullanma eğiliminde olacaktır.)
- FA Graybill, İstatistikteki Uygulamalarla Matrisler . (Yukarıdakilere eşlik eden metin. Bol miktarda iyi matris cebiri, buradaki istatistiklere faydalıdır. Mükemmel çalışma ortamı referansı.)
- Devroye, Gyorfi ve Lugosi, Örüntü Tanımadaki Olasılıklı Bir Teori . (Sınıflandırma problemlerinde performansın ölçülmesi ile ilgili titiz ve teorik metin.)
- Brockwell ve Davis, Zaman Serileri: Kuram ve Yöntemler . (Klasik zaman serileri analizi. Teorik tedavi. Daha çok uygulamalı olanlar için, Box, Jenkins & Reinsel veya Ruey Tsay'ın metinleri iyi.)
- Motwani ve Raghavan, Randomize Algoritmalar . (Hesaplamalı algoritmalar için olasılıksal yöntemler ve analiz.)
- D. Williams, Olasılık ve Martingales ve / veya R. Durrett, Olasılık: Teori ve Örnekler . (Ölçüm teorisini görmüşseniz, diyelim ki, DL Cohn düzeyinde, ancak olasılık teorisi olmayabilir. Ölçü teorisini zaten biliyorsanız, her ikisi de hızla hızlanmak için iyidir.)
- F. Harrell, Regresyon Modelleme Stratejileri . ( İstatistiksel Öğrenme Elemanları [ESL] kadar iyi değil , ama farklı ve ilginç şeyleri üstlenir, ESL'den daha "geleneksel" uygulamalı istatistik konularını kapsar ve kesinlikle bilmeye değerdir.)
Daha İleri (Doktora Düzeyinde) Metinler
Lehmann ve Casella, Nokta Tahmin Teorisi . (Doktora düzeyinde nokta tahmini tedavisi. Bu kitabın zorluğunun bir kısmı, onu okumak ve bir yazım hatası olup olmadığını bulmaktır. Onları hızlı bir şekilde tanıdığınızda kendinizi anladığınızı anlayacaksınız. Çok fazla pratik var. Bu tür orada, özellikle sorunlara dalıyorsanız.)
Lehmann ve Romano, İstatistiksel Hipotezlerin Test Edilmesi . (Doktora düzeyinde hipotez testinin tedavisi. Yukarıdaki TPE kadar yazım hatası yoktur.)
A. van der Vaart, Asimptotik İstatistikler . (Asimptotik istatistik teorisi üzerine güzel bir kitap, uygulama alanlarına dair iyi ipuçları veriyor. Uygulanan bir kitap değil. Tek sorunum oldukça tuhaf bir gösterimin kullanılması ve detayların halının altında fırçalanması.)