Değişkenlerdeki hatalar regresyonu: üç siteden veri toplamak için geçerli mi?


15

Son zamanlarda bir istemci bana bir bootstrap analizi yapmak için geldi çünkü bir FDA inceleme değişkenleri hataları regresyon geçersiz olduğunu söyledi, çünkü sitelerden veri toplarken analiz iki sitenin bazı örnekleri dahil üç siteden veri havuzu içerir aynısı.

ARKA FON

Müşteri, göstermek istediği yeni bir test yöntemine sahip, mevcut bir onaylanmış yönteme "eşdeğerdir". Yaklaşımları, aynı örneklere uygulanan her iki yöntemin sonuçlarını karşılaştırmaktı. Testi yapmak için üç site kullanıldı. Her sitedeki verilere değişkenlerdeki hatalar (Deming regresyonu) uygulandı. Fikir şu ki, regresyon eğim parametresinin 1'e yakın olduğunu ve kesişme noktasının 0'a yakın olduğunu gösterdiğinde, bu iki test tekniğinin neredeyse aynı sonuçları verdiğini ve dolayısıyla yeni yöntemin onaylanması gerektiğini gösterecektir. 1. bölgede 45 eşli gözlem veren 45 örnek vardı. Bölge 2, 40 numune ve bölge 3, 43 numune içermektedir. Üç ayrı Deming regresyonu yaptılar (iki yöntemin ölçüm hataları için 1 oranında olduğu varsayılarak). Böylece algoritma, kare dik mesafelerin toplamını en aza indirdi.

Başvurularında, müşteri, 1. ve 2. sahalarda kullanılan örneklerin bazılarının aynı olduğuna dikkat çekmiştir. İncelemede FDA incelemesi, Deming regresyonunun geçersiz olduğunu, çünkü modelin varsayımlarını geçersiz kılan "parazite" neden olan ortak örnekler kullanıldığını söyledi. Bu müdahaleyi dikkate almak için Deming sonuçlarına bir önyükleme ayarlaması uygulanmasını istediler.

O noktada müşteri getirildi bootstrap nasıl bilmiyordu. Müdahale terimi garipti ve tam olarak gözden geçirenin ne alıyordu emin değildi. Ben gerçekten nokta toplanan verilerin ortak örnekleri olduğu için ortak örnekler için korelasyon olacağını ve dolayısıyla model hata terimlerinin tüm bağımsız olmayacağını varsaydım.

MÜŞTERİNİN ANALİZİ

Üç ayrı regresyon çok benzerdi. Her biri 1'e yakın eğim parametrelerine ve 0'a yakın kesişimlere sahipti.% 95 güven aralığı, her durumda eğim ve kesişme için sırasıyla 1 ve 0'ı içeriyordu. Temel fark, saha 3'te biraz daha yüksek kalıntı varyansıydı. Ayrıca, bunu OLS yapmanın sonuçlarıyla karşılaştırdılar ve çok benzer olduklarını buldular (sadece bir durumda OLS'ye dayanan eğim için güven aralığı 1 içermiyordu). Eğim için OLS CI'nın 1 içermediği durumda, aralığın üst sınırı 0.99 gibi bir şeydi.

Sonuçların üç site de havuzda birbirine benzer olması site verilerinin makul görünüyordu. Müşteri, benzer sonuçlara yol açan toplanmış bir Deming gerilemesi yaptı. Bu sonuçlar göz önüne alındığında, müşteri için regresyonların geçersiz olduğu iddiasına itiraz eden bir rapor yazdım. Benim iddiam, her iki değişkente de benzer ölçüm hataları olduğu için, müşterinin Deming regresyonunu anlaşma / anlaşmazlık göstermenin bir yolu olarak kullanma hakkı olduğu. Belirli bir bölge regresyonlarında ilişkili hatalar ile ilgili bir sorun yoktu, çünkü belirli bir bölgede hiçbir örnek tekrarlanmadı. Daha sıkı güven aralıkları elde etmek için verileri birleştirme.

Bu zorluk, sadece site 1'deki ortak örneklerle verilerin bir araya getirilmesiyle giderilebilir. Ayrıca üç ayrı site modelinde sorun yoktur ve geçerlidir. Bana öyle geliyor ki, havuz oluşturmadan bile güçlü bir anlaşma kanıtı sağlıyorum. Ayrıca, ölçümler ortak bölgeler için bağımsız olarak 1 ve 2 bölgelerinde alınmıştır. Bu yüzden site 1'deki bir örnek için ölçüm hataları, site 2'deki karşılık gelen örnekteki ölçüm hataları ile ilişkili olmadığından, tüm verileri kullanan havuzlanmış analizlerin bile geçerli olduğunu düşünüyorum. Bu gerçekten tasarımda bir noktanın tekrarlanması anlamına geliyor. sorun olmamalı. Korelasyon / "müdahale" yaratmaz.

Raporumda, ayarlanacak bir korelasyon olmadığı için bir bootstrap analizinin gereksiz olduğunu yazdım. Üç saha modeli geçerliydi (sahalar içinde olası "etkileşim" yok) ve havuzlama yapılırken saha 1'deki ortak numunelerin çıkarılmasıyla birleştirilmiş bir analiz yapılabilir. Böyle bir havuzlanmış analizde bir girişim sorunu olamazdı. Ayarlanacak önyargı olmadığından, bir önyükleme ayarlaması gerekli olmayacaktır.

SONUÇ

Müşteri analizimi kabul etti ancak FDA'ya götürmekten korktu. Yine de bootstrap ayarlamamı istiyorlar.

SORULARIM

A) (1) Müşterinin sonuçlarını analiz etmem ve (2) bootstrap'in gereksiz olduğu iddiamı kabul ediyor musunuz?

B) Deming regresyonunu önyüklemek zorunda olduğum göz önüne alındığında, Bootstrap örneklerinde Deming regresyonunu yapabilmem için kullanılabilecek SAS veya R prosedürleri var mı?

EDIT: Bill Huber önerisi göz önüne alındığında ben değişkenleri hatalar regresyon sınırlarını hem y üzerinde x hem de y üzerinde regresyon ile bakmayı planlıyorum. OLS'un bir sürümü için, iki hata varyansının eşit olduğu varsayıldığında cevabın aslında değişkenlerdeki hatalarla aynı olduğunu zaten biliyoruz. Bu diğer regresyon için doğruysa, bu Deming regresyonunun uygun bir çözüm verdiğini göstereceğini düşünüyorum. Katılıyor musun?

Müşterinin talebini karşılamak için belirsiz bir şekilde tanımlanan talep edilen bootstrap analizini yapmam gerekiyor. Etik olarak sadece bootstrap sağlamanın yanlış olacağını düşünüyorum çünkü müşterinin gerçek problemini gerçekten çözmez, bu da test ölçüm prosedürünü haklı çıkarır. Bu yüzden onlara hem analizler vereceğim hem de en azından FDA'ya bootstrap yapmanın yanı sıra ters regresyon yaptığımı ve daha uygun olduğunu düşündüğüm Deming regresyonlarını sınırladığını söylemelerini isteyeceğim. Ayrıca, analizin yöntemlerinin referansa eşdeğer olduğunu ve Deming regresyonunun da yeterli olduğunu göstereceğini düşünüyorum.

Deming regresyonunu önyüklemem için @whuber'ın cevabında önerdiği R programını kullanmayı planlıyorum. R'ye çok aşina değilim ama bence yapabilirim. R Studio ile birlikte R yükledim. Bu benim gibi bir acemi için yeterince kolay olacak mı?

Ayrıca SAS var ve SAS daha rahat programlama. Herkes SAS bunu yapmanın bir yolunu biliyorsa, ben bunu bilmek takdir ediyorum.


2
Bu sorunun cevabını bilmiyorum, ancak tamamen politik bir temelde, FDA'nın istediği şeyi yapmak ve (en azından muhtemelen) sonuçların benzer olduğunu göstermek daha iyi olmaz mı? (İyi soru, BTW, +1)
Peter Flom - Monica'yı eski durumuna döndürün

1
Evet @ PeterFlom FDA için analiz yapmanın ve göstermenin önemli olmadığını kabul ediyorum. Fakat regresyonların sonuçlarını ve sonuçlarını diplomatik olarak işaret etmenin ve örtüşen örnekler olmadan havuz oluşturmanın tartışmayı güçlendirdiğini düşünüyorum. Ben bootstrap yapacağım ama bağımsız olarak kodlamadan Deming regresyonunu kendim yapmak için mevcut yazılımı bulmakta yardım kullanabilirim.
Michael R. Chernick

2
Michael, "siteler" için ortak olan "örnekler" olasılığı, bu (soyut) terimlerin ne anlama gelebileceğine dair bazı doğal yorumları sorgulamaktadır. Örneğin, başlangıçta "siteler" i farklı coğrafi konumlar ve "örnekler" , her biri bağımsız ölçümlere tabi tutulan bu konumlarla ilişkili ayrı varlıklar olarak düşündüm . Bu modelde, numunelerin farklı sahalarda ortak olması mümkün değildir. Bu terimlerle ne demek istediğinizi açıklığa kavuşturabilir misiniz ?
whuber

3
@whuber siteleri farklı yerlerdir. Örnekler bireylerden alınan sitratlı plazmalardır. Laboratuar testi farklı zamanlarda farklı sitelerde yapılır. Karşılaştırmalar, aynı işlevi gerçekleştirmesi amaçlanan iki test ölçüm cihazı içindir. Siteler 1 ve 2'de örneklerin bazıları yeniden kullanıldı, ancak cihazlar site 1 ve site 2'de bağımsız olarak çalıştırıldı. Bu yüzden aynı örnekler (veya aynı örneklerin bölümleri) kullanılmasına rağmen ölçüm hatalarının gerçekten bağımsız olduğunu söylüyorum .
Michael R. Chernick

1
a) Çoğaltılan numunenin havuzda toplanan analizden çıkarılmasının bağımsızlık eksikliğiyle ilgili endişeleri ortadan kaldırdığına katılıyorum. b) Çok az sayıda SAS kullanıcısı, nadir regresyon yöntemlerini içeren bootstrap analizleri için R'yi kullanmanın "kolay" olduğunu düşünmektedir. Önyükleme analizleri gerçekten işlevsel programlama düşünme modunu gerektirir ve bu SAS'ın teşvik ettiği bir mod değildir.
DWin

Yanıtlar:


10

Bu karşılıklı bir kalibrasyon problemidir: yani iki bağımsız ölçüm cihazını nicel olarak karşılaştırmak.

İki ana konu var gibi görünüyor. Birincisi (yalnızca soruda yer alan) sorunu çerçevelemekte: yeni bir yöntemin onaylanmış bir yöntemle "eşdeğer" olup olmadığı nasıl belirlenmelidir? İkincisi, bazı örneklerin birden fazla ölçüldüğü verilerin nasıl analiz edileceğiyle ilgilidir.

Soruyu çerçeveleme

Belirtilen problemin en iyi (ve belki de bariz) çözümü , karşılaştırılabilir ortamdan (insan plazması gibi) elde edilen doğru bilinen değerlere sahip örnekleri kullanarak yeni yöntemi değerlendirmektir . (Bu genellikle gerçek numuneleri bilinen konsantrasyonda standart malzemelerle ekleyerek yapılır.) Bu yapılmadığından, bunun mümkün olmadığını veya düzenleyiciler tarafından kabul edilemeyeceğini varsayalım (herhangi bir nedenle). Böylece, biri referans olarak kullanılan iki ölçüm yöntemini karşılaştırmaya indirgenmişiz, çünkü doğru ve tekrarlanabilir olduğuna inanılıyor (ancak mükemmel hassasiyet olmadan).

Gerçekte, müşteri FDA'nın yeni yönteme onaylanan yöntem için bir vekil veya vekil olarak izin vermesini isteyecektir. Bu nedenle yükleri, yeni yöntemden elde edilen sonuçların, onaylanmış yöntemin uygulanmış olsaydı ne belirleyeceğini yeterli bir doğrulukla öngöreceğini göstermektir. Bu ince yönü biz olmasıdır değil tahmin etmeye çalışarak gerçek değerlerin kendisi - biz bile bunları bilmiyoruz. Bu nedenle, değişkenlerdeki hatalar regresyonu bu verileri analiz etmenin en uygun yolu olmayabilir.

YXXYYXYX. (Tecrübelerime göre bu yaklaşım muhafazakar katı olma eğilimindedir: her iki ölçüm de son derece doğru, kesin ve doğrusal olarak ilişkili değilse bu aralıklar şaşırtıcı derecede büyük olabilir.)

Yinelenen örnekleri adresleme

Buradaki ilgili kavramlar örnek destek ve varyans bileşenleridir. "Örnek destek", bir öznenin gerçekte ölçülen fiziksel kısmını (burada bir insan) ifade eder. Öznenin bir kısmı alındıktan sonra, genellikle ölçüm işlemi için uygun alt numunelere bölünmesi gerekir. Alt örnekler arasında değişiklik olasılığı konusunda endişe duyabiliriz. İyi karıştırılmış bir sıvı numunede, örnek boyunca altta yatan miktarda (bir kimyasalın konsantrasyonu gibi) hiçbir değişiklik yoktur, ancak katı veya yarı katı (örn. Kan içerebilir) numunelerinde, bu varyasyon önemli. Bir ölçüm yapmak için laboratuvarların genellikle sadece bir çözeltinin mikrolitrelerine ihtiyaç duyduğu göz önüne alındığında, neredeyse mikroskopik ölçekte varyasyon konusunda endişe duymalıyız. Bu önemli olabilir.

Bu tür varyasyon ihtimali olanfiziksel bir örnek, ölçüm sonuçlarındaki varyasyonun ayrı "varyans bileşenlerine" ayrılması gerektiğini belirtir. Bir bileşen, numune içi varyasyondan sapmadır ve diğerleri, sonraki ölçüm sürecinin her bağımsız adımından sapmaya katkıda bulunur. (Bu adımlar alt örneklemenin fiziksel eylemini, örneğin stabilizatör veya santrifüjleme gibi numunenin kimyasal ve fiziksel olarak işlenmesini, örneğin ölçüm cihazına enjeksiyonunu, cihaz içindeki varyasyonları, aletler arasındaki varyasyonları ve diğerlerini içerebilir. enstrümanı kimin çalıştırdığı, laboratuvarlardaki olası çevre kirliliği ve daha fazlası nedeniyle varyasyonlar, umarım bu, bu soruyu cevaplamak için gerçekten iyi bir iş yapmak için, istatistikçinin tüm örnekleme ve analitik sürecin tam olarak anlaşılması gerekir. Tek yapabileceğim bazı genel rehberlik sağlamak.)

Bu düşünceler eldeki soru için geçerlidir, çünkü iki farklı "bölgede" ölçülen bir "örnek" aynı kişiden elde edilen ve daha sonra laboratuarlar arasında bölünen iki fiziksel örnektir. Onaylanan yöntemle yapılan ölçüm bir parça bölünmüş numuneyi kullanır ve yeni yöntemle eşzamanlı ölçüm, bölünmüş numunenin başka bir parçasını kullanır. Bu bölünmelerin ima ettiği varyans bileşenlerini göz önüne alarak, sorunun ana konusunu çözebiliriz. Şimdi, bu eşleştirilmiş ölçümler arasındaki farklılıkların iki şeye bağlanması gerektiği açıktır: Birincisi, ölçüm prosedürleri arasındaki gerçek farklar - değerlendirmeye çalıştığımız şey budur - ikincisi, içindeki herhangi bir değişiklikten kaynaklanan farklılıklarölçülecek olan iki alt numunenin ekstrakte edilmesinin fiziksel işlemlerinden kaynaklanan varyasyonun yanı sıra varyasyon. Eğer örnek homojenlik ve alt-numûne alma süreci ile ilgili fiziksel muhakeme varyans ikinci biçimi ihmal edilebilir olduğu kurabilir, o zaman gerçekten de gözden geçiren tarafından talep edilen herhangi bir "girişim" yoktur. Aksi takdirde, bu varyans bileşenlerinin ters regresyon analizinde açıkça modellenmesi ve tahmin edilmesi gerekebilir.


1
Bu sorunu çözmenin en iyi yolunu öneren çok güzel bir analiz için teşekkür ederiz. Ancak benim özel durumumda müşteri Deming regresyon yaklaşımını seçti ve farklı bir yöntem aramıyor. Deming regresyonuna FDA onjection sadece girişimden kaynaklanıyor gibi görünüyor ve problemi çözmek için önerileri bir çeşit bootstrap düzeltmesi. Sadece getirildim çünkü bootstrap nasıl yapılacağını bilmiyorlar. Hiçbir istatistikçi içermiyorlar ve raporumda verdiğim gibi sonuçların istatistiksel analizini yapmamışlardı.
Michael R. Chernick

2
Kısıtlamaları takdir ediyorum (ve bu konuda açık olmalı). Bununla birlikte, genel olarak, bu gibi soruları çözmek için iyi bir çerçeve, kalkış noktanız olarak uygun bir model almaktır. Uygunsuz bir yaklaşım ve geçersiz bir model (bir istemciyi tatmin etmek için) kullanarak bir çözüm yolunuza gitmeye çalışırsanız, yalnızca hataları bir araya getirecek ve açıkça savunulabilir bir çözüme ulaşamayacaksınız. Şimdi düşünebileceğiniz şey, Deming regresyonunun ters regresyondan nasıl değiştiği ve Deming regresyonunun birden fazla varyans bileşenini barındırmak için nasıl uyarlanabileceğidir.
whuber

1
Deming regresyonunun, daha önce uygulandığı gibi, daha olağan veya uygun bir yöntemin üreteceği şeye yeterince yakın olduğunu göstermek için motive olabilirsiniz : böyle bir gösteri durumunuzda mümkün olan en iyi çözüm olabilir.
whuber

Bunun yerine yaptıkları sadece sorunu ve verilerin nasıl toplandığını tanımlamak ve Deming regresyonunun çıktısını göstermekti. Bir istatistikçi dahil olsaydı, Deming gerilemesi hakkında daha az istatistiksel sorun ortaya çıkmış olabilir. Klinet için yapabileceğim tek şey, yapılan analiz için bir vaka sağlamaktır (bu, regresyonun çoğunun ortak bir kaynaktan tekrarlanan örneklemeden kaynaklanan müdahale konusunda endişelenmeden neden analiz edilebileceğinin bir açıklamasını içerir) ve istenen önyüklemeyi sağlamaktır toplanan modelde kalan varyans için ayarlama.
Michael R. Chernick

Bu noktada onlara ters gerileme yapmalarını söyleyemem. Bir ölçüm yöntemi onaylanırsa, referans olarak görülebilir ve şirket üzerindeki yük, yeni yöntemin referansla aynı işi yaptığını göstermektir. Bunun için Deming regresyonunun FDA tarafından uygun ve en azından kabul edilebilir olduğunu düşünüyorum. Muhtemelen tekrarlanan numuneler sorunu ortaya çıkmasaydı olurdu. Onlar havuz yaptıkları zaman bizim tekrarlanan örneklerden birini terk olsaydı bu sorun ortaya çıkmazdı.
Michael R.Chickick
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.