Şimdiye kadar yüksek boyutlu veri kümeleriyle cezalandırılmış çok değişkenli analizde anladığımı özetlemeye çalışıyorum ve hala yumuşak eşikleme ile Kement (veya ) doğru bir tanımını elde mücadele ediyorum .
Daha kesin olarak, genomik veriler ( tek nükleotid polimorfizmleri dahil olmak üzere 2 bloklu veri yapısını analiz etmek için seyrek PLS regresyonunu kullandım ( burada nüklel aletin frekansını {0,1,2} aralığında sayısal bir değişken olarak kabul ediyoruz) ve sürekli fenotipler (kişilik özellikleri veya serebral asimetriyi ölçen skorlar, sürekli değişkenler olarak da ele alınır). Fikir, bireyler arası fenotipik varyasyonları açıklamak için en etkili prediktörleri (burada DNA dizisindeki genetik varyasyonlar) izole etmekti.
Başlangıçta cezalandırılmış PLS regresyonu ve düzenli CCA içeren mixOmics R paketini (eski adıyla integrOmics
) kullandım . R koduna baktığımızda, öngörücülerdeki "sparsity" değerinin, Bileşen, (algoritma üzerinde en yüksek yüklere (mutlak değerde) sahip en üst değişkenleri seçilerek oluşturulduğunu gördük. yinelemeli ve bileşenlerine değişken yüklerini hesaplama , her yinelemede yordayıcı bloğunu söndürme , bkz. Seyrek PLS: Genel Bakış için Omics verilerini Entegre ederken Değişken Seçim ). Aksine, S. Keleş'in birlikte yazdığı spls paketi (bkz.Eşzamanlı Boyut Küçültme ve Değişken Seçimi için seyrek Kısmi En Küçük Kareler Regresyonu , bu yazarlar tarafından üstlenilen yaklaşımın daha resmi bir açıklaması için) değişken ceza için kanalizasyon uygular .
Yumuşak eşiklemeye dayalı yinelemeli özellik seçimi ile düzenlenmesi arasında katı bir "bijection" olup olmadığı açık değildir . Benim sorum şu: İkisi arasında herhangi bir matematiksel bağlantı var mı?
Referanslar
- Chun, H. ve Kele ,s, S. (2010), Eşzamanlı boyut küçültme ve değişken seçim için seyrek kısmi en küçük kareler . Kraliyet İstatistik Kurumu Dergisi: Seri B , 72 , 3-25.
- Le Cao, K.-A., Rossouw, D., Robert-Granie, C. ve Besse, P. (2008), Omics Verilerini Entegre ederken Değişken Seçim için Seyrek PLS . Genetik ve Moleküler Biyolojide İstatistiksel Uygulamalar , 7 , Madde 35.