Tukey Median Polish, algoritma mikrodizilerin RMA normalizasyonunda kullanılır . Bildiğiniz gibi, mikrodizi verileri oldukça gürültülüdür, bu nedenle tüm problar ve mikrodiziler için gözlemleri dikkate alarak prob yoğunluklarını tahmin etmenin daha sağlam bir yoluna ihtiyaç duyarlar. Bu, diziler arasındaki probların yoğunluklarını normalleştirmek için kullanılan tipik bir modeldir.
Yij=μi+αj+ϵij
i=1,…,Ij=1,…,J
Burada , dizisindeki probu için dönüştürülmüş PM yoğunluğudur . arka plan gürültüsüdür ve normal doğrusal regresyondaki gürültüye karşılık geldiği varsayılabilir. Ancak, ilgili bir dağıtım varsayımı kısıtlayıcı olabilir, bu nedenle ve için tahminleri almak üzere Tukey Medyan Lehçe kullanırız . Bu, diziler arasında normalleşmenin sağlam bir yoludur, çünkü sinyali, probdan kaynaklanan yoğunluğu, dizi efektinden ayırmak istiyoruz, . dizi efekti için normalleştirerek sinyali elde edebilirizYijlogithjthϵijϵμi^αj^ααj^tüm diziler için. Böylece, sadece prob efektleri artı bazı rastgele gürültü ile bırakılır.
Daha önce sözünü ettiğim bağlantı, farklı olarak ifade edilen genleri veya "ilginç" genleri prob etkisine göre sıralayarak tahmin etmek için Tukey medyan cila kullanır. Ancak, kağıt oldukça eskidir ve muhtemelen o zaman insanlar hala mikrodizi verilerinin nasıl analiz edileceğini bulmaya çalışıyordu. Efron'un parametrik olmayan ampirik Bayesian yöntemleri makalesi 2001'de geldi, ancak muhtemelen yaygın olarak kullanılmamış olabilir.
Bununla birlikte, şimdi mikrodiziler hakkında çok fazla şey anlıyoruz (istatistiksel olarak) ve istatistiksel analizlerinden oldukça eminiz.
Mikroarray verileri oldukça gürültülüdür ve RMA (Median Polish kullanan) en popüler normalleştirme yöntemlerinden biridir, basitliği nedeniyle olabilir. Diğer popüler ve sofistike yöntemler şunlardır: GCRMA, VSN. Faiz dizi etkisi değil prob etkisi olduğu için normalleştirmek önemlidir .
Beklediğiniz gibi, analiz genler arasında bilgi borçlanmasından yararlanan bazı yöntemlerden faydalanmış olabilir. Bunlar, Bayes veya ampirik Bayes yöntemlerini içerebilir. Okuduğunuz kağıt eski olabilir ve bu teknikler o zamana kadar çıkmamıştı.
İkinci noktanızla ilgili olarak, evet muhtemelen deneysel verileri değiştiriyorlar. Ancak, bence, bu değişiklik daha iyi bir amaç için, bu nedenle haklı. Nedeni
a) Mikroarray verileri oldukça gürültülüdür. İlgi prob etkisi olduğunda, verileri RMA, GCRMA, VSN, vb. İle normalleştirmek gereklidir ve verilerdeki herhangi bir özel yapıdan faydalanmak iyi olabilir. Ama ikinci kısmı yapmaktan kaçınırdım. Bunun nedeni, yapıyı önceden bilmiyorsak, çok fazla varsayım dayatmamak daha iyidir.
b) Mikrodizi deneylerinin çoğu, doğası gereği keşifçidir, yani araştırmacılar, daha ileri analizler veya deneyler için birkaç "ilginç" gen grubunu daraltmaya çalışmaktadır. Bu genler güçlü bir sinyale sahipse, normalizasyonlar gibi modifikasyonların nihai sonuçları (büyük ölçüde) etkilememesi gerekir.
Bu nedenle, değişiklikler gerekçelendirilebilir. Ama şunu belirtmeliyim ki, normalleşmeleri aşmak yanlış sonuçlara yol açabilir.