Teori ve matematikte eşit strese sahip iyi bir kitap


10

Okul yıllarımda ve üniversitede istatistikler konusunda yeterli kurs aldım. CI, p değerleri, istatistiksel anlamlılığı yorumlama, çoklu test, korelasyon, basit doğrusal regresyon (en küçük karelerle) (genel doğrusal modeller) ve tüm hipotez testleri gibi kavramları iyi anlıyorum. Daha önceki günlerin çoğunu çoğunlukla matematiksel olarak tanıştırmıştım. Ve son zamanlarda, Sezgisel Biyoistatistik kitabının yardımıyla , gerçek kavramsal teoriye doğru kavranmış ve benzeri görülmemiş bir anlayışa inanıyorum.

Şimdi, eksik bulduğum şey, uygun modelleri (modele parametreleri tahmin etmek) ve benzerlerini anlamak. Özellikle, maksimum olasılık tahmini, genelleştirilmiş doğrusal modeller, çıkarımsal istatistiklere bayes yaklaşımı gibi kavramlar her zaman benim için yabancı görünür. Basit olasılıklı modellerde veya internetteki diğer (temel) konularda bulacağı gibi yeterli örnek veya öğretici veya kavramsal olarak sağlam olanlar yoktur.

Ben bir biyoinformatikçiyim ve diyelim ki gen ekspresyonunu (veya diferansiyel gen ekspresyonunu) bulmaya yönelik ham okuma sayılarıyla ilgilenen RNA-Seq verileri üzerinde çalışıyorum. Arka planımdan, istatistiksel modellere aşina olmasam bile, bir poisson dağılımı varsayımı ve negatif binomiyallerin nedenini kavrayabiliyorum. Ancak bazı makaleler genelleştirilmiş doğrusal modellerle ilgileniyor ve bir MLE vb. Anlamak için gerekli altyapıya sahip olduğuma inanıyorum.

Sanırım istediğim, aranızdaki bazı uzmanların yararlı olduğunu düşündüğü bir yaklaşım ve (a) bu kavramları daha sezgisel bir şekilde kavramama yardımcı olan kitaplardır (sadece titiz matematik değil, matematikle desteklenen teori). Çoğunlukla bunları uygulayacağım için, (şu anda) neyin ne olduğunu anlamaktan memnun olurum ve daha sonra titiz matematiksel kanıtlara geri dönebilirim ... Kimsenin tavsiyesi var mı? İstediğim konular gerçekten bir kitapta yer almak için dağılmışsa 1'den fazla kitap almayı umursamıyorum.

Çok teşekkür ederim!


Bana RNA-Seq verileri ve bu alandaki istatistiksel zorluklar hakkında bilgi edinmek için iyi kaynaklar önerebilir misiniz?
Biostat

1
biostat, elbette, seqanswers.com web sitesi NGS için çok iyi bir kaynaktır. Farklı teknolojiler ve bunların nasıl çalıştığı ile başlayabilirsiniz: goo.gl/NLuvJ NGS verileriyle ilgili bazı istatistiksel sorunları açıklayan bazı makaleler. Kısacası, bunlar teknik ve biyolojik varyans tahminidir (gen ifadesi ile ilgili olarak). 1) Teknik varyasyonu değerlendiren ilk makalelerden biri: ncbi.nlm.nih.gov/pubmed/18550803 2) DESeq: gen ifadesi tespiti için bir araç: ncbi.nlm.nih.gov/pubmed?term=DESeq%20simon%20anders
Arun

1
Bir sürü iyi öneri sunulacak gibi gözüktüğü için CW'ye dönüştürüldü ve aralarında "en iyi" ye karar vermek için belirgin bir objektif standart yok. Umarım bu, okuyucuların cevapları çok oylamasını da kolaylaştıracaktır :-).
whuber

whuber, tabi! mantıklı. Topluluk wiki yayını yapabilir miyim? ya da moderatör ayrıcalıkları mı gerektirir?
Arun

Yanıtlar:


5

Sorduğunuz Bayesli olmayan her şeyi Frank Harrell'in Regresyon Modelleme Stratejileri'nde bulacaksınız . Bayesian önerilerini daha bilgili insanlara bırakardım (her ne kadar Gelman, Carlin, Stern ve Rubin yanı sıra Gilks, Richardson ve Speigelhalter , kitaplığımda ). Piyasada birkaç Bayes biyostat kitabı bulunmalıdır.

Güncelleme: McCullach ve Nelder (1989) tabii ki GLM'ler üzerine klasik bir kitap. Zamanı için çığır açıcıydı, ama açıkçası oldukça sıkıcı buluyorum. Ayrıca, artık teşhis, sıfır şişirilmiş modeller veya çok düzeyli / hiyerarşik uzantılar gibi sonraki eklemeleri de kapsamaz. Hardin ve Hilbe (2007) bu yeni şeylerden bazılarını Stata'daki pratik örneklerle (GLM'lerin ve uzantıların çok iyi uygulandığı; sandviç tahmincisi).


Merhaba StasK, çok teşekkür ederim! Regresyon modellemenin gereksinimlerimi karşılayacağını düşünüyorum. GLM'leri ne kadar kapsamaktadır? Bayesian çıkarım ile ilgili referanslarınızın her zaman tavsiye ettiğim standartlar olduğunu görüyorum. Sizce, takip etmek ne kadar kolay / zor (seviye çok ilerlemiş gibi)? Ayrıca, Genelleştirilmiş doğrusal modeller kitabına da baktınız mı? Yazarlardan biri JA Nelder. Ayrıca, istatistiksel modeller üzerine bu kitabı da satın almak istiyorum . Bu konuda düşüncelerin var mı? Teşekkürler!
Arun

Bu Freedman'ın kitabını görmedim. Çok ilginç olmasına rağmen, titizlik açısından oldukça hafif görünse de, bundan memnun olduğumdan emin değilim. (Matris cebri olmadan regresyon hakkında konuşan, ancak bilimsel titizlikten ÇOK derin olan matematik üzerine çok hafif bir kitap, Angrist ve Pischke tarafından Çoğunlukla Zararsız Ekonometri'dir ve nedensel modellerle çalışıyorsanız, bu kitap bir zorunluluktur.) matematik / stat arka planınızı gerçekten bilmiyorum, bu yüzden bu kitapların zor olup olmadığına karar vermem zor olacak. Bazı Bayes kitapları olabilir; zaten MLE ve GLM'yi bildiğinizi varsayarlar.
StasK

1
Yanıtımı McCullach ve Nelder referansını içerecek şekilde güncelledim.
StasK

Ben bir elektronik mühendisiyim. biyoinformatik uzmanı. İstatistikler (iletişim teorisi için), olasılık ve rasgele süreçler üzerine kurslarım var, kalkülüs (biraz paslı olmasına rağmen) ve ayrıca doğrusal cebir ile rahatım. Tabii ki bunlar çoğunlukla lisans seviyesidir ... Hedefim kavramsal olarak sağlam olmak (daha fazla geometrik yorum, yöntemlerin anlaşılması ve en önemlisi amaç) vb ... Tabii ki, matematiğe aldırmıyorum bu tariflerle birlikte geliyor. Önerileriniz için tekrar teşekkürler!
Arun

3

Bu kitaplar iyi şeyleri açıklıyor ama OP'nin sorduğu şeyleri açıklamıyor.
StasK

@StasK, Yukarıdaki kitaplarda olmayan şeyleri açıklayabilir misiniz?
Biostat

HTF'den ders verdim ve öğrettiğim şey, temel işlevler, etkili serbestlik dereceleri, model seçimi, kement, çapraz doğrulama, vb. İle ilgiliydi. İstatistik öğrencisinin genel istatistik eğitiminden bu tür şeylere aşina olduğu ya da CS öğrencilerinin ikili sonuç verilerine diz sarsıntılı tepki olarak lojistik regresyon yerine SVM kullanacağı varsayılmaktadır. Bayesli şeylerden sadece bir anlamda Bayesci karar kurallarının optimal olduğu ölçüde bahsedilmektedir; MCMC veya eşlenik yok, diyelim.
StasK

"Biyoinformatik için istatistiksel yöntemler" kitabını okudunuz mu?
Biostat

@ biostat, hayır, bilmiyorum. Biyoinformatikte çalışmıyorum, ama bunun biraz farklı bir dünya olduğunu biliyorum. Bu yüzden makul önerilerde bulunamıyorum. Kanımca, GLM, GEE, uzunlamasına ve hayatta kalma modelleri gibi modellerle ilgilenen biyoistatistik dalı, ekonometri ile daha fazla ortaklaşa sahiptir (bu nedenle Wooldridge'in kesitsel ve panel veri modelleri hakkındaki kitabı çalışan bazı biyostat insanlar için iyi bir öneri olabilir. bu modellerle) uzmanlık alanınız gibi görünen istatistiksel genetik, ailevi hata oranı kontrolü ve veri madenciliği ile karşılaştırıldığında.
StasK
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.