Hiçbir zaman doğrudan kullanmadım, bu yüzden sadece bazı tekniklerimi ve bu teknikle ilgili genel düşünceleri (esas olarak sorularınızı 1 ve 3'e hitap eden) paylaşabilirim.
Genel olarak bislustering anlayışım, gen kümelerini ve bireyleri gruplamayı açıklamaya çalıştığımız genetik çalışmalardan (2-6) geliyor: kısaca, gen ifadesinin benzer profilini paylaşan grup örneklerini arıyoruz (bu ilgili olabilir) örneğin hastalık durumuna) ve bu gen profili oluşturma modeline katkıda bulunan genlere. Biyolojik "masif" veri kümeleri için son teknoloji ürünü bir anket Pardalos'un slaytları Biclustering'de mevcuttur . Mikrodizi verisine uygulamaları olan bir R paketi, biclust olduğunu unutmayın .
Aslında, ilk fikrim bu metodolojiyi klinik tanıya uygulamaktı, çünkü özellikleri veya değişkenleri birden fazla kümeye koymaya izin veriyor, bu da semeiyolojik bir bakış açısından ilginç çünkü kümelenme semptomları sendromu tanımlamaya izin veriyor , ancak bazı semptomlar farklı hastalıklarda çakışma. İyi bir tartışma Cramer ve ark., Komorbidite: Bir ağ perspektifinde bulunabilir (Davranışsal ve Beyin Bilimleri 2010, 33, 137-193).
Biraz ilgili bir teknik işbirlikçi filtrelemedir . Su ve Khoshgoftaar ( Yapay Zekada Gelişmeler , 2009): İşbirlikçi Filtreleme Teknikleri Üzerine Bir Araştırma . Diğer referanslar sonunda listelenmiştir. Belki de pazar sepeti probleminde örneklendiği gibi sık sık öğe kümesinin analizi de bununla bağlantılıdır, ancak bunu hiç araştırmadım. Birlikte kümelemenin başka bir örneği, metin madenciliğinde olduğu gibi sözcükleri ve belgeleri aynı anda kümelemek istediğimiz zamandır, örneğin Dhillon (2001). İki taraflı spektral grafik bölümleme kullanarak belgeleri ve kelimeleri birlikte kümeleme . Proc. KDD , sayfa 269-274.
Bazı genel referanslar hakkında, yararlı bulacağınızı umduğum çok kapsamlı olmayan bir liste:
- Jain, AK (2010). Veri kümeleme: K-araçlarının 50 yıl ötesinde . Örüntü Tanıma Mektupları , 31 , 651–666
- Carmona-Saez ve diğ. (2006). Pürüzsüz olmayan negatif olmayan matris çarpanlarına ayırma yoluyla gen ekspresyon verilerinin bisikterlenmesi . BMC Biyoinformatik , 7 , 78.
- Prelic ve diğ. (2006). Gen ekspresyon verileri için bisikter yöntemlerinin sistematik olarak karşılaştırılması ve değerlendirilmesi . Biyoinformatik , 22 (9) , 1122-1129. www.tik.ee.ethz.ch/sop/bimax
- DiMaggio ve diğ. (2008). Sistem biyolojisinde veri matrislerinin optimum yeniden sıralanması yoluyla bisikterleme: titiz yöntemler ve karşılaştırmalı çalışmalar . BMC Biyoinformatik , 9 , 458.
- Santamaria ve diğ. (2008). BicOverlapper: İki yönlü görüntüleme için bir araç . Biyoinformatik , 24 (9) , 1212-1213.
- Madeira, SC ve Oliveira, AL (2004) Biyolojik veri analizi için bisikter algoritmaları: bir anket . IEEE Çev. Comput. Biol. Bioinform. , 1 , 24-45.
- Badea, L. (2009). Çakışan Biclusters için Genelleştirilmiş Kümegramları . IJCAI
- Symeonidis, P. (2006). En Yakın Biclusters İşbirlikçi Filtreleme . WEBKDD