PLS regresyonu ve PLS yol modellemesi arasındaki fark. PLS Eleştirisi


12

Bu soru burada soruldu, ancak kimse iyi bir cevap vermedi. Bu yüzden tekrar gündeme getirmek iyi bir fikir ve ayrıca daha fazla yorum / soru eklemek istiyorum.

  • İlk soru "PLS yol modellemesi" ile "PLS regresyonu" arasındaki fark nedir? Daha genelleştirmek için yapısal eşitlik modellemesi (SEM), yol modellemesi ve regresyon nedir? Anladığım kadarıyla regresyon daha çok tahmine odaklanırken, SEM odak noktası yanıt ve öngörücüler arasındaki ilişkiye odaklanır ve yol modelleme SEM'in özel bir örneğidir?

  • İkinci sorum PLS'nin ne kadar güvenilir olduğu? Son zamanlarda Rönkkö ve ark. 2016 ve Rönkkö ve ark. 2015 gibi yüksek katmanlı dergilerde PLS dayalı kağıtları reddedilmesine açar, Operasyon Yönetimi Dergisi ( burada dergi editörü gelen notudur):

    Tüm PLS tabanlı el yazmalarını masa başında reddediyoruz, çünkü PLS'nin OM araştırmacılarının kullandığı model çeşitlerinde istisnasız yanlış modelleme yaklaşımı olduğu sonucuna vardık .

    Alanımın ne yönetim / psikoloji ne de istatistik spektroskopi olduğunu not etmeliyim. Yukarıda bağlantılı makalelerde yazarlar bir SEM yöntemi olarak PLS hakkında daha fazla konuşuyorlar, ancak bana göre eleştirileri PLS regresyonu için de geçerli görünüyor.


Bağlantılarınızın hepsi ödeme duvarlarının arkasında.
Jeremy Miles

kesinlikle haklısın! ve üzgünüm, PDF'lerim var ama karşıya yükleyip paylaşamayacağımdan emin değilim. Bilim özgür olmalı :)
Ress

PLS regresyonu istatistik.stackexchange.com/questions/179733 adresinde oldukça ayrıntılı olarak açıklanmış ve tartışılmıştır . Ne yazık ki "yol modelleme" hakkında hiçbir şey bilmiyorum.
amoeba

"Yol modelleme" SEM için başka bir isim olduğunu düşünüyorum
rep_ho

2016 makalesinden: "PLS ile ilgili en giriş metinleri, PLS'nin SEM olduğunu ve bu nedenle kompozitler ile regresyona göre bir avantaj sağlaması gerektiğini öne sürerek, ağırlıkların amaçlarına göre parlıyor; ancak, bu tür çalışmalar çoğu zaman açıkça PLS'nin kendisinin de sadece kompozitlerle gerileme olduğuna işaret etmez. " yanıltıcıdır. Argümün ana itişi, yazarların SEM'in saf bir teorik yapı olması gerektiğini iddia edip etmediklerini ve ampirik olarak türetilmiş yapısal denklemler için küçümsediklerini görebiliyorum. Ancak PLS, kovaryans yoluyla 'yapılandırılmış' denklemler türetmiştir.
ReneBt

Yanıtlar:


9

İlk soru "PLS yol modellemesi" ile "PLS regresyonu" arasındaki fark nedir?

Yok, eşanlamlılar.

Daha genel kılmak için, yapısal denklem modellemesi (SEM), yol modellemesi ve regresyon nedir? Anladığım kadarıyla regresyon daha çok tahmine odaklanırken, SEM odak noktası yanıt ve öngörücüler arasındaki ilişkiye odaklanır ve yol modelleme SEM'in özel bir örneğidir?

SEM bir gerileme şeklidir. Regresyon, bağımsız ve bağımlı değişkenleri ilişkilendiren ve ayrı varlıklar olarak işlenen birden çok değişkeni kullanan yöntemleri içeren herhangi bir yöntemdir. SEM son modeli kısıtlamak için değişkenler arasındaki matematiksel ilişkileri özellikle kullanır, PLS durumunda bu kovaryanstır. Anladığım kadarıyla, yol modelleme bir alan- (benim değil, ben sizin gibi bir spektroskopistim) belirli bir terimdir.

İkinci sorum PLS'nin ne kadar güvenilir olduğu? Son zamanlarda Rönkkö ve ark. 2016 ve Rönkkö ve ark. 2015

Mükemmel bir çürütme Henseler ve ark. 2013 PLS Hakkında Ortak İnançlar ve Gerçeklik . Rönkkö ve ark. PLS'nin ortak bir gizli faktör varsaydığı bazı durumlarda iyi performans göstermediğidir. PLS, gerçek dünyada çok daha yaygın olan bir durum olan birden fazla gizli faktörü ele almak için tasarlanmıştır.

Ne kadar güvenilir? Spektroskopi için mükemmel bir araçtır, ancak sınırlamaları vardır. Altta yatan birden fazla faktörden katkıları yakalayan karmaşık modeller oluşturabileceğinden aşırı sığdırma riski taşır. Bu nedenle dikkatli kullanılmalıdır ve uygun dış validasyon önemlidir, ancak daha sonra bu uyarılar tüm model oluşturma araçları için geçerlidir. Esasen 2 yıl boyunca gerçek dünya veri kümeleri üzerinde çalışıyorum ve bağımlı değişkeni destekleyen tek bir ortak faktöre (ne verilere ne de bilimsel teoriye dayanarak) dayanan herhangi bir deneysel veri kümesiyle karşılaşmadım.


1
+1 olsa da bu yanıtın Ronkko ve ark. vs Henseler ve ark. anlaşmazlık. Ben hiç bir spektroskopist değilim ama doğrusal regresyon için bir düzenleme yöntemi olarak PLS'yi nispeten iyi anladım ( Hastie ve ark. Tarafından İstatistiksel Öğrenmenin Unsurları'nda bu şekilde sunulmaktadır ). Sanırım kemometride PLS1 deniyor. Burada "performans" rekonstrüksiyon hatası ile ilgilidir, regülasyon gücü, vb. Seçmek için çapraz doğrulama kullanılabilir. Bu, sırt regresyonu veya PCR veya benzeri herhangi bir şeyle karşılaşan herkes için çok tanıdık bir ayardır.
amoeba

[devamı] Ayrıca çoklu bağımlı değişkenli PLS2'nin farkındayım, ancak bunun ne sıklıkta kullanıldığından emin değilim. Aynı zamanda, Ronkko ve ark. Yani, "SEM" in odağı sadece çoklu X ile çoklu Y'yi ilişkilendirmek (o zaman PLS2 mi?) ve belki de daha çok Y'nin tahmininden ziyade X ve Y arasındaki ilişkiyi yorumlamaktır. "Performans" ile ne anlama geldiklerinden bile emin değilim ve PLS'yi eleştirdiklerinde PLS yerine ne kullanmayı tercih ettikleri hakkında hiçbir fikrim yok .
amip

ReneBT ve amip için teşekkürler. Bu soruyu burada Reddit'e gönderdim ve birisi (soumya_ray) regresyon ve SEM'in temel olarak farklı olduğunu yanıtladı. Teknik farklılıkları açıklamadı. Btw, cevabı söylediklerinize karşı (cevabınız bana mantıklı geliyor).
Ress

Btw, PLS kullanarak bant seçimi yapıyorum. PLS performansıyla ilgili noktanızı onaylıyorum, ancak iyi tahminlerle sonuçlanabilir (hem test hem de kalibrasyonda), ancak model temel olarak yanlış olabilir veya en azından yorumlamak çok zor olabilir, çünkü öngörücülerle ilgisi olmayan önemli değişkenler olarak seçilebilir yanıt değişkeni.
Ress

Yazarlar tarafından dile getirilen kilit konular hakkında daha fazla yorum: "PLS algoritması böylece verilerde herhangi bir korelasyon kullanarak başlangıç ​​noktası olarak kullanılan birim ağırlıklı kompozitler ile karşılaştırıldığında bitişik kompozitler arasındaki korelasyonu artıran ağırlıklar üretir, ancak bu msgstr "herhangi bir küresel optimumun elde edilmesini garanti etmiyoruz". Geçerli bir endişe, kısacası, modelin sadece aynı temel kovaryans yapısına sahip popülasyonlara uygulanacağı, PLS'yi geçersiz kılmadığı, ancak kişinin dikkatli bir model oluşturması ve kullanması gerektiği anlamına gelir.
ReneBt
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.