İstatistik teorisi ve uygulamalarından anlam çıkarma


13

Kısa bir süre önce mühendislik matematiği ile birlikte tıbbi ve biyolojik modelleme üzerine yüksek lisansımı bitirdim. Eğitim programım oldukça yüksek notlarla yönettiğim matematik istatistikleri üzerine önemli miktarda ders içermesine rağmen (bir liste için aşağıya bakın), genellikle istatistik teorisine ve uygulamalarına bakarken tamamen kayboldum. Şunu söylemeliyim ki, "saf" matematiğe kıyasla, istatistikler benim için gerçekten çok az mantıklı. Özellikle çoğu istatistikçi tarafından kullanılan gösterimler ve dil (geçmiş öğretim görevlilerim dahil) rahatsız edici derecede kıvrımlıdır ve şimdiye kadar gördüğüm kaynakların neredeyse hiçbiri (wikipedia dahil), kolayca verilen teori ile kolayca ilişkilendirilebilecek ve ilişkilendirilebilecek basit örneklere sahip değildi. ..

Bu arka plan; Ayrıca, özellikle biyoinformatik alanında, istatistiklere sıkıca dokunmadan bir araştırmacı / mühendis olarak kariyer yapamayacağım acı gerçeğin farkındayım.

Daha deneyimli istatistikçilerden / matematikçilerden bazı ipuçları alabileceğimi umuyordum. Yukarıda bahsettiğim bu sorunun üstesinden nasıl gelebilirim? İyi kaynakları biliyor musunuz? kitaplar, e-kitaplar, açık kurslar (iTunes veya OpenCourseware for ex aracılığıyla) vb.

DÜZENLEME: Bahsettiğim gibi, genel istatistik başlığı altında literatürün büyük bir kısmına karşı oldukça önyargılıyım ve istatistik dalı başına birkaç büyük (ve pahalı) ders kitabı alamıyorum. bir kitap açısından Tipler ve Mosca'nın Fizik için ne olduğuna benzer , ama bunun yerine istatistikler için.

Tipler hakkında bilmeyenler için; daha yüksek çalışmalar sırasında karşılaşılabilecek konuların büyük çoğunluğunu kapsayan ve her birini temel girişten biraz daha derinlere kadar sunan geniş bir ders kitabıdır. Temelde mükemmel bir referans kitabı, ilk yıl boyunca üniversitede aldım, arada bir kullanıyorum.


İstatistiklerle ilgili aldığım dersler:

  • büyük bir tanıtım kursu,
  • durağan stokastik süreçler,
  • Markov süreçleri,
  • Monte Carlo yöntemleri
  • Hayatta kalma analizi

Yanıtlar:


4

Durumunu tamamen anlayabiliyorum. Doktora öğrencisi olmama rağmen bazen ilgili teori ve uygulamaları zor buluyorum. Kendinizi anlayış teorisine sokmak istiyorsanız, gerçek dünya problemlerini düşündüğünüzde kesinlikle ödüllendirici olur. Ancak süreç sinir bozucu olabilir.

Sevdiğim birçok referanstan biri Gelman ve Hill'in Hiyerarşik / Çok Seviyeli Modeller Kullanarak Veri Analizi . Temel kavramları simülasyonları kullanarak ifade edebilecekleri teoriden kaçınırlar. MCMC vb. Deneyiminiz olduğu sürece kesinlikle size fayda sağlayacaktır. Söylediğiniz gibi, biyoinformatik alanında çalışıyorsunuz, muhtemelen Harrell'in Regresyon Modelleme Stratejileri de büyük bir referans.

Bunu bir topluluk wiki'si yapacağım ve başkalarının eklemesine izin vereceğim.


Konuya gösterdiğiniz ilgi için teşekkür ederiz. Bu şeyleri karıştıran tek kişinin ben olmadığımı görmek güzel. Bununla birlikte, durumumu abarttığınızı düşünüyorum; bir takım dersler aldım ve birkaç farklı istatistiksel analiz yolunun varlığına aşina olduğum halde; derslerden sonra benimle hiç yapışmazlar. Sınavlardan birkaç ay sonra kendimi merak ederek bulmaya devam ediyorum; "Bunu bir yerde gördüm / duydum, ama gerçekten nasıl çalıştı?" Bu bana her şeyi yıkmam ve daha güçlü bir temel ile inşa etmeye başlamam gerektiğini gösteriyor.
posdef

Harrell'in (not yazım) metni için yankılanan bir "katılıyorum" ekleyeceğim. Kendisine eşlik eden R kodunun iki paketli kombinasyonu gibi mükemmel. Ben de Venables ve Ripley tarafından "S ile Modern Uygulamalı İstatistik" iyi bir satın alma olacağını düşünüyorum. R öğrenmek için MASS kullanmadan önce yüksek lisans düzeyinde bir geçmişim vardı (fizik lisans derecesi ile). Bu metinde çok fazla uygulama bilgeliği var.
DWin

Gelman regresyon kitabı harika, her şeyi çok iyi açıklıyor ve malzeme hakkındaki anlayışınızı kontrol etmek için gerçekten yararlı olan R kodunu sağlıyor.
richiemorrisroe

2

Bayesian Veri Analizine aşina mısınız (Gelman, Carlin, Stern ve Rubin tarafından)? Belki bir doza ihtiyacın var.


2

Tüm istatistik sorunları esas olarak aşağıdaki 4 adıma dayanır (ki başka bir soruya @whuber cevabından ödünç aldım ):

  1. Parametreyi tahmin edin.

  2. Bu tahminin kalitesini değerlendirin.

  3. Verileri keşfedin.

  4. Uygunluğu değerlendirin.

Kelime parametresini kelime modeli ile değiştirebilirsiniz .

İstatistik kitapları genellikle çeşitli durumlar için ilk iki noktayı sunar. Her gerçek dünya uygulamasının farklı bir yaklaşım, dolayısıyla farklı bir model gerektirmesi sorunu, bu nedenle kitapların büyük bir kısmı bu farklı modelleri kataloglamaya son veriyor. Bu, ayrıntılarda kendinizi kaybetmenin ve büyük resmi kaçırmanın kolay olduğu istenmeyen bir etkiye sahiptir.

Yürekten tavsiye ettiğim büyük resimli kitap Asimptotik istatistikler . Konunun titiz bir tedavisini verir ve matematiksel olarak "saf" dır. Başlığı asimptotik istatistiklerden bahsetmesine rağmen, anlatılmamış olan büyük sır, klasik istatistik yöntemlerinin çoğunun özünde asimtotik sonuçlara dayanmasıdır.


2

Bence buradaki en önemli şey istatistik ve bazı genel istatistiksel kavramlar hakkında bir sezgi geliştirmektir. Belki de bunu yapmanın en iyi yolu, "sahip olabileceğiniz" bir alan adına sahip olmaktır. Bu, alan hakkında bilgi sahibi olmanın, temel istatistikler hakkında daha fazla bilgi sahibi olmanıza yardımcı olduğu ve alan adı hakkında daha fazla bilgi edinmenize yardımcı olduğu olumlu bir geri bildirim döngüsü sağlayabilir.

Benim için bu alan beyzbol istatistikiydi. Ben bir oyunda 4 için 3 giden bir meyilli bir "gerçek" .750 vurucu olmadığını anladım. Bu, örnek verilerin temel dağılımla aynı olmadığı konusunda daha genel bir noktanın anlaşılmasına yardımcı olur. Ayrıca muhtemelen ortalama bir oyuncuya .750 vurucusundan daha yakın olduğunu biliyorum, bu yüzden ortalamaya regresyon gibi kavramları anlamaya yardımcı olur. Oradan, önceki olasılık dağılımımın ortalama beyzbol oyuncusu ortalamasının olduğu bir tam gelişmiş Bayesian çıkarımına ulaşabilirim ve şimdi posterior dağılımımı güncellemek için 4 yeni örneğim var.

Bu alanın sizin için ne olduğunu bilmiyorum, ama sadece bir ders kitabından daha yararlı olacağını tahmin ediyorum. Örnekler, örnekleri anlamaya yardımcı olan teoriyi anlamaya yardımcı olur. Örnekleri olan bir ders kitabı güzel, ancak bu örnekleri "sizinkine" yapmazsanız, onlardan yeterince alıp alamayacağınızı merak ediyorum.



1

Herkes farklı öğrenir, ancak örneklerin, örneklerin, örneklerin istatistiklerde çok yardımcı olduğunu söylemenin güvenli olduğunu düşünüyorum. Benim önerim R'yi öğrenmek olacaktır (sadece temeller çok yardımcı olmak için yeterlidir) ve sonra gözleriniz kanayana kadar her örneği deneyebilirsiniz. Sıralayabilir, sığdırabilir, çizebilir, adlandırırsınız. Ve R, istatistiklere yönelik olduğundan, R'yi öğrendikçe, istatistikleri öğreneceksiniz. Listelediğiniz bu kitaplar "bana göster" açısından saldırıya uğrayabilir.

R ücretsiz olduğu ve çok fazla kaynak malzeme ücretsiz olduğu için, yatırım yapmanız gereken tek şey zamanınızdır.

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/rstuff/rtutor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htm

http://www.statmethods.net/about/books.html

R'de satın alabileceğiniz birçok iyi kitap var, işte kullandığım kitap:

http://www.amazon.com/Introductory-Statistics-R-Peter-Dalgaard/dp/0387954759

Düzenleme ============

Birkaç bağlantı eklemeyi unuttum. Windows kullanıyorsanız, R'yi beslemek için iyi bir editör Tinn-R'dir (bir başkası Mac veya Linux'ta editörler için bağlantılar ekleyebilir).

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


bağlantılar için teşekkürler, önümüzdeki haftalarda olabildiğince fazla deneyeceğim ... Daha önce bir kez, çok değişkenli regresyon (cox ve aelen) yaptığımız hayatta kalma analizi dersinde R'ye maruz kaldım modeller) ve gerçekten hatırlayamadığım bir sürü başka şey. MATLAB'a çok alışmış bir kişi olarak R izlenimim oldukça olumsuzdu, ancak havuzun derin ucuna az çok atıldığımız ve daha sonra öğrenmeyi beklediğimiz gerçeğiyle ilgisi vardı. kendi
başımıza

1

Ben şahsen sevilen bu (örnekler sürü) teori ve uygulamanın gerçekten iyi bir karışım vardı. Daha teori odaklı bir yaklaşım için casella ve berger ile iyi bir eşleşti. Ve genel geniş fırça bu .


Her iki kitabın da amazon hakkında iyi değerlendirmeleri var, herkes bunlarla ilgili herhangi bir görüş (belki biraz daha ayrıntılı) ekleyebilir misiniz? bTW; Yani "İstatistiksel Çıkarım" mı demek istediniz?
posdef

Evet, 'istatistiksel çıkarım'. Benim için, modelleri test etmek ve modellerin parametrelerini tahmin etmek için verilerin nasıl kullanılacağını anlamak için olasılık modellerini anlamaktan büyük bir adım geçiyordu. Özellikle Davison kitabı gerçekten bu noktaya odaklanıyor.
alwaysean
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.