Korelasyonlu matrisin SVD'si ilave olmalı, fakat görünmüyor


29

Sadece , Gen İfade Verilerinden İlişkili Biclusters Bulma adlı aşağıdaki makalede yapılan bir talebi kopyalamaya çalışıyorum :

Önerme 4. Eğer . o zaman biz var:XIJ=RICJT

ben. Eğer ek model ile mükemmel bir bicluster ise, sütunlar üzerinde korelasyon ile mükemmel bir bicluster; ii. Eğer ilave model ile mükemmel bir bicluster ise, o zaman sıralar üzerinde korelasyona sahip mükemmel bir bicluster; iii. Eğer her iki ve katkı modeli ile mükemmel biclusters, o zaman mükemmel korelasyon bicluster olup.RIXIJ
CJXIJ
RICJXIJ

Bu önermeler kolayca kanıtlanabilir ...

... ama elbette, kanıtlamıyorlar.

Bu önermeyi gösterip gösteremediğimi görmek için makaledeki bazı basit örnekleri artı base + custom R kodunu kullanıyorum.

corbic <- matrix(c(0,4,-4,2,2,-2,6,0,4,-8,16,-2,-2,10,-14,4), ncol=4)

(Tablo 1F'den)

Standart X = formunu makalede açıklandığı gibi ye dönüştürmek için bazı özel kodlar :UdVTX=RCT

svdToRC <- function(x, ignoreRank = FALSE, r = length(x$d), zerothresh=1e-9) {
#convert standard SVD decomposed matrices UEV' to RC' form
#x -> output of svd(M)
#r -> rank of matrix (defaults to length of singular values vector)
            # but really is the number of non-zero singular values
#ignoreRank -> return the full decomposition (ignore zero singular values)
#zerothresh -> how small is zero?

    R <- with(x, t(t(u) * sqrt(d)))
    C <- with(x, t(t(v) * sqrt(d)))

    if (!ignoreRank) {
        ind <- which(x$d >= zerothresh)
    } else {
        ind <- 1:r
    }

    return(list(R=as.matrix(R[,ind]), C=as.matrix(C[,ind])))
}

bu işlevi veri kümesine uygulayın:

 > svdToRC(svd(corbic))
$R
           [,1]       [,2]
[1,]  0.8727254 -0.9497284
[2,] -2.5789775 -1.1784221
[3,]  4.3244283 -0.7210346
[4,] -0.8531261 -1.0640752

$C
          [,1]       [,2]
[1,] -1.092343 -1.0037767
[2,]  1.223860 -0.9812343
[3,]  3.540063 -0.9586919
[4,] -3.408546 -1.0263191

Halüsinasyon yapmadığım sürece, bu matrisler, korbik satırlar ve sütunlar arasında mükemmel bir korelasyon sergilese de, katkı maddesi değildir. Sağladıkları örneğin, bir tür ön veya post-transformasyon aşamasını kaçırmadığım sürece, sahip olmaları gereken özelliği sergilemeleri garip görünüyor.


3
Merhaba, zzk: Buradaki mükemmel bicluster tanımını kısaca belirtmek faydalı olabilir, çünkü (a) herkes kağıda erişemeyebilir ve (b) bir kişinin varsaydığı genelliğe bağlı olarak birkaç farklı şey anlamına gelebilir.
kardinal

1
temelde, matrisin sütunlarına vs tüm satırlar vs satırlar ve sütunlar arası ortalama korelasyon puanları mutlak değeri 1 olan
zzk

3
Kafam karıştı. Öyle 4iiidemiyor P(R), P(C), additivity => P(X)mu? ( YKısaca "mükemmel bicluster" dır P(Y)). Öyle görünüyor ki diğer yöne gidiyorsunuz, bu katkının diğer koşullardan beklenenleri. Lütfen daha fazla açıklayın.
Stumpy Joe Pete

Stumpy - Ar & Ge'de ilave katkı bekliyorum çünkü tedarik ettiğim matrisin (corbic) mükemmel bir korelasyon gösterdiğini biliyorum - bu, makalenin kendisinde verildiği gibi mükemmel bicluster.
zzk

6
Hala yanlış yöne gittiğini düşünüyorum. 4iii demiyor eğer Xbir mükemmel sonra bicluster korelasyon Rve Ckatkı olacaktır. Sonuç diğer yöne gider. Şimdi, verdikleri örneğin yanındaki teoremlere uymuyor görünmesinin garip olduğuna katılıyorum. Belki sağlayabileceğiniz başka bilgiler var mı? Diğer yöne giden başka bir teorem var mı?
Stumpy Joe Pete

Yanıtlar:


2

Bu makaledeki 'bicluster' ifadesinin bir matrisin bir alt kümesine , "bir sütun alt kümesinde benzer davranış sergileyen bir satır alt kümesine" veya bunun tersi olduğuna dikkat edin. Veri kaynaklarının tanımlanması genellikle veri madenciliği algoritmalarında yapılır. Yazarlar, bu alt kümeleri tanımlamak için kullanılan önceki modellerden farklı olan yeni bir 'ilişkili bikluster modeli' önermektedir. Genetik hakkında hiçbir şey bilmiyorum ama buradaki karışıklık oldukça açık ve iki kaynaktan geliyor gibi görünüyor:

1. 'Katkı' kelimesinin kullanımı

Bu makalede, fonksiyonun çıktısında verilen iki matrisin "katkı maddesi" olması gerektiği anlamına gelmez, eğer "katkı maddesi" varsa, katkı maddesi ters çevirmeleri OP ile kastedilen şeydir. Yazarlar bu anlamda katkı kelimesini kullanmamaktadır. "Her satır veya sütunun başka bir satıra veya sütuna bir sabit ekleyerek elde edilebildiği" ek modeliyle bir bicluster elde etmeye değiniyorlar.

2. Hatalı Önerme 4.3

RICJXIJXIJRICJRICJ ters şekilde katkı maddesi olmalı ya da bir katkı modeline uygun olması gerekir.

* Ayrıca, örnek veriler makalede tartışılan öneriden tamamen farklı bir bölümden gelir.


Web sitemizdeki en çok cevaplanan cevapsız soruyu nihayet cevapladığımı görmek harika! +1 makaleyi okumamama ve yazdıklarınızın doğru olduğunu beyan edemem; ama makul görünüyor.
amip Reinstate Monica’nın
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.