Gözlenen alel frekansı tahmin edilenden önemli ölçüde daha düşük mü?


10

Soru : Gözlenen "dağ" -aleli frekansının (Şekil 1), ortadan güney dağlara, ekolojik seçim modeli tarafından tahmin edilenden (Şekil 2) önemli ölçüde daha düşük olup olmadığını belirlemek için nasıl bir test yapabilirim ( ayrıntılar için aşağıya bakın )?

Sorun : İlk düşüncem, model artıklarını enlem: boylam ve irtifaya (sadece enlem ve boylam arasındaki etkileşime neden olan önemli ölçüde) indirgemekti. Sorun, artıkların (Şekil 3) model tarafından açıklanmayan varyasyonu yansıtabilmesi ve / veya bunların biyolojik bir şey olduğu, örneğin alelin güneye potansiyeline yayılması için zamanının olmaması veya gen akışında bir engel olması. Gözlenen (Şekil 1) ile beklenen (Şekil 2) dağ-alel frekanslarını karşılaştırırsanız, özellikle İsveç ve Norveç'in orta ve güney dağlarında belirgin bir fark vardır. Modelin tüm varyasyonları açıklamayabileceğini kabul ediyorum, ancak dağ-alelin ortadan güney dağlara potansiyeline ulaşmadığı fikrini araştırmak için makul bir test yapabilir miyim?

Arka fon: Frekans dağılımı dağ (ve enlem: boylam) ile İskandinav yarımadasındaki ova habitatları ile ilişkili görünen iki allelik bir AFLP marketim var (Şekil 1). "Dağ" -aleli neredeyse dağlık olan kuzeyde sabittir. Dağlarda eksik olan güneydeki "ova" -aleli için neredeyse yoktur veya sabittir. Biri dağlarda kuzeye doğru güneye doğru ilerledikçe "dağ" -elele daha düşük sıklıkta ortaya çıkar. Kuzeyden güneye "dağ" -aleli sıklığındaki bu farklılık, bölge hem kuzeyden hem de güneyden kolonize olduğu için filogeografi veya tarihsel süreçlerden kaynaklanabilir. Örneğin, dağ aleli kuzey popülasyonundan kaynaklanıyorsa, belki de tamamen güney nüfusa genişleme zamanı olmamıştır,

Benim çalışma hipotezim "dağ" -aleli frekansının ekolojik seleksiyonun bir sonucu olduğudur (sıfır hipotez nötr seleksiyondur).

Ekolojik seçim modelim için, yanıt değişkeni olarak binomel allel frekansına sahip genelleştirilmiş bir katkı modeli (GAM) kullandım (Fennoscandinavia'da her bölgede örneklenen 10 ila 20 kişi örneklenmiş 129 bölge) ve öngörücü değişkenler. Model sonuçları aşağıdaki gibidir (TMAX04-06 = Nisan-Haziran aylarında maksimum sıcaklık, Phen_NPPMN = ortalama büyüme mevsimi bitki örtüsü verimliliği, PET_HE_YR = yıllık potansiyel buharlaştırma, Dist_Coast = kıyıya uzaklık):

Family: binomial 
Link function: logit 

Formula: Binomial_WW1 ~ s(TMAX_04) + s(TMAX_05) + s(TMAX_06) + s(Phen_NPPMN) + 
s(PET_HE_YR) + s(Dist_Coast)

Parametric coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -0.74372    0.04736   -15.7   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

Approximate significance of smooth terms:
             edf Ref.df Chi.sq  p-value    
s(TMAX_04)    3.8100  4.812 25.729 9.43e-05 ***
s(TMAX_05)    0.8601  1.000  5.887  0.01526 *  
s(TMAX_06)    0.8862  1.000  7.644  0.00569 ** 
s(Phen_NPPMN) 6.2177  7.375 39.028 3.16e-06 ***
s(PET_HE_YR)  3.1882  4.147 18.039  0.00145 ** 
s(Dist_Coast) 2.2882  2.857  9.725  0.01906 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

R-sq.(adj) =  0.909   Deviance explained = 89.7%
REML score = 326.73  Scale est. = 1         n = 129

resim açıklamasını buraya girin

Şekil 1. Bi-allelik AFLP markörü için gözlemlenen "dağ" -aleli frekansı. Kontur çizgileri 0,1 frekans aralığı, renk gölgeleme en düşük ve en yüksek kırmızılar için maviyle yüksekliktir.

resim açıklamasını buraya girin

Şekil 2. Bi-allelik AFLP markörü için öngörülen "dağ" -aleli frekansı. Kontur çizgileri 0,1 frekans aralığı, renk gölgeleme en düşük ve en yüksek kırmızılar için maviyle yüksekliktir.

resim açıklamasını buraya girin

Şekil 3. Tüm çalışma alanı (Fennoscandinavia) tarafından ayrı ayrı ve Norveç, İsveç ve Finlandiya için ayrı ayrı ekolojik seçim modeli (GAM kullanarak) kalıntıları. Kırmızı kesik çizgiler, diğer AFLP belirteçlerinden çıkarılan kuzey ve güney nüfusları arasındaki ikincil temas bölgesini ve Afrika'daki ayrı kışlama alanlarında yetişen tüylerin kararlı izotop analizini temsil eder. İnce siyah noktalı çizgi bölgenin merkezidir.


1
Çok miktarda ayrıntı için teşekkürler. Sıfır model soruna nasıl giriyor? Sadece ekolojik seçim modelinin gözlemlenen ile beklenen arasındaki karşılaştırmada önemli olduğu görülmektedir.
gui11aume

Burada gerçek verileriniz nedir? Model çıktısında "n = 129" yazıyor, ancak 129 kişi mi yoksa her birinde alel frekansınız olan 129 konum mu, yoksa ...?
onestop

Üzgünüm, geliştirdiğim el yazması yaklaşımımın mantığını (veya mantıksız) en iyi şekilde anlayabilmeniz için mümkün olduğunca çok arka plan sağlamak istedim. Sorum üstte duruyor, gözlemlenen ve beklenen arasındaki farkın önemli ölçüde farklı olup olmadığını belirlemek için bir neden bulmak istiyorum. Bu bana alelin hala yayılıp yayılmadığını veya beklenen değere ulaşmada bir engel olup olmadığını bildirebilir. "N = 129" 'a gelince, bu bir alel frekansı olduğu için, bu, her bir bölgede tipik olarak 10 ila 20 kişi örneklenmiş 129 bölge anlamına gelir.
Keith Larson

Bireylerin maternal ve otozomal lokuslar için panmiktik göründüğünden bahsediyorsunuz. Bu verilere erişiminiz var mı? Panmixiyi nasıl değerlendirdiniz?
Sameer

Yanıtlar:


1

Bu soru ölü olabilir, ancak buradaki grafikler muhteşem ve buradaki cevap sezgisel olarak açık. Eğer bir "dağ" aleli arıyorsanız, bariz seçim irtifayı tahmin ediciniz olarak kullanmak olacaktır. Eğer bu alel sıklığı ile anlamlı bir ilişki gösterirse, hipoteziniz için güçlü kanıtlar sağlayacaktır.

Dağın diğer yönlerini açıklayan yüksekliğini - örneğin arazi "pürüzlülüğünü" veya vejetasyon türünü - benzersiz dağlık olan ve aynı zamanda alel frekansı ile ilişkili olabilecek daha öngörücü değişkenler ekleyebilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.