Son zamanlarda bir istemci bana bir bootstrap analizi yapmak için geldi çünkü bir FDA inceleme değişkenleri hataları regresyon geçersiz olduğunu söyledi, çünkü sitelerden veri toplarken analiz iki sitenin bazı örnekleri dahil üç siteden veri havuzu içerir aynısı.
ARKA FON
Müşteri, göstermek istediği yeni bir test yöntemine sahip, mevcut bir onaylanmış yönteme "eşdeğerdir". Yaklaşımları, aynı örneklere uygulanan her iki yöntemin sonuçlarını karşılaştırmaktı. Testi yapmak için üç site kullanıldı. Her sitedeki verilere değişkenlerdeki hatalar (Deming regresyonu) uygulandı. Fikir şu ki, regresyon eğim parametresinin 1'e yakın olduğunu ve kesişme noktasının 0'a yakın olduğunu gösterdiğinde, bu iki test tekniğinin neredeyse aynı sonuçları verdiğini ve dolayısıyla yeni yöntemin onaylanması gerektiğini gösterecektir. 1. bölgede 45 eşli gözlem veren 45 örnek vardı. Bölge 2, 40 numune ve bölge 3, 43 numune içermektedir. Üç ayrı Deming regresyonu yaptılar (iki yöntemin ölçüm hataları için 1 oranında olduğu varsayılarak). Böylece algoritma, kare dik mesafelerin toplamını en aza indirdi.
Başvurularında, müşteri, 1. ve 2. sahalarda kullanılan örneklerin bazılarının aynı olduğuna dikkat çekmiştir. İncelemede FDA incelemesi, Deming regresyonunun geçersiz olduğunu, çünkü modelin varsayımlarını geçersiz kılan "parazite" neden olan ortak örnekler kullanıldığını söyledi. Bu müdahaleyi dikkate almak için Deming sonuçlarına bir önyükleme ayarlaması uygulanmasını istediler.
O noktada müşteri getirildi bootstrap nasıl bilmiyordu. Müdahale terimi garipti ve tam olarak gözden geçirenin ne alıyordu emin değildi. Ben gerçekten nokta toplanan verilerin ortak örnekleri olduğu için ortak örnekler için korelasyon olacağını ve dolayısıyla model hata terimlerinin tüm bağımsız olmayacağını varsaydım.
MÜŞTERİNİN ANALİZİ
Üç ayrı regresyon çok benzerdi. Her biri 1'e yakın eğim parametrelerine ve 0'a yakın kesişimlere sahipti.% 95 güven aralığı, her durumda eğim ve kesişme için sırasıyla 1 ve 0'ı içeriyordu. Temel fark, saha 3'te biraz daha yüksek kalıntı varyansıydı. Ayrıca, bunu OLS yapmanın sonuçlarıyla karşılaştırdılar ve çok benzer olduklarını buldular (sadece bir durumda OLS'ye dayanan eğim için güven aralığı 1 içermiyordu). Eğim için OLS CI'nın 1 içermediği durumda, aralığın üst sınırı 0.99 gibi bir şeydi.
Sonuçların üç site de havuzda birbirine benzer olması site verilerinin makul görünüyordu. Müşteri, benzer sonuçlara yol açan toplanmış bir Deming gerilemesi yaptı. Bu sonuçlar göz önüne alındığında, müşteri için regresyonların geçersiz olduğu iddiasına itiraz eden bir rapor yazdım. Benim iddiam, her iki değişkente de benzer ölçüm hataları olduğu için, müşterinin Deming regresyonunu anlaşma / anlaşmazlık göstermenin bir yolu olarak kullanma hakkı olduğu. Belirli bir bölge regresyonlarında ilişkili hatalar ile ilgili bir sorun yoktu, çünkü belirli bir bölgede hiçbir örnek tekrarlanmadı. Daha sıkı güven aralıkları elde etmek için verileri birleştirme.
Bu zorluk, sadece site 1'deki ortak örneklerle verilerin bir araya getirilmesiyle giderilebilir. Ayrıca üç ayrı site modelinde sorun yoktur ve geçerlidir. Bana öyle geliyor ki, havuz oluşturmadan bile güçlü bir anlaşma kanıtı sağlıyorum. Ayrıca, ölçümler ortak bölgeler için bağımsız olarak 1 ve 2 bölgelerinde alınmıştır. Bu yüzden site 1'deki bir örnek için ölçüm hataları, site 2'deki karşılık gelen örnekteki ölçüm hataları ile ilişkili olmadığından, tüm verileri kullanan havuzlanmış analizlerin bile geçerli olduğunu düşünüyorum. Bu gerçekten tasarımda bir noktanın tekrarlanması anlamına geliyor. sorun olmamalı. Korelasyon / "müdahale" yaratmaz.
Raporumda, ayarlanacak bir korelasyon olmadığı için bir bootstrap analizinin gereksiz olduğunu yazdım. Üç saha modeli geçerliydi (sahalar içinde olası "etkileşim" yok) ve havuzlama yapılırken saha 1'deki ortak numunelerin çıkarılmasıyla birleştirilmiş bir analiz yapılabilir. Böyle bir havuzlanmış analizde bir girişim sorunu olamazdı. Ayarlanacak önyargı olmadığından, bir önyükleme ayarlaması gerekli olmayacaktır.
SONUÇ
Müşteri analizimi kabul etti ancak FDA'ya götürmekten korktu. Yine de bootstrap ayarlamamı istiyorlar.
SORULARIM
A) (1) Müşterinin sonuçlarını analiz etmem ve (2) bootstrap'in gereksiz olduğu iddiamı kabul ediyor musunuz?
B) Deming regresyonunu önyüklemek zorunda olduğum göz önüne alındığında, Bootstrap örneklerinde Deming regresyonunu yapabilmem için kullanılabilecek SAS veya R prosedürleri var mı?
EDIT: Bill Huber önerisi göz önüne alındığında ben değişkenleri hatalar regresyon sınırlarını hem y üzerinde x hem de y üzerinde regresyon ile bakmayı planlıyorum. OLS'un bir sürümü için, iki hata varyansının eşit olduğu varsayıldığında cevabın aslında değişkenlerdeki hatalarla aynı olduğunu zaten biliyoruz. Bu diğer regresyon için doğruysa, bu Deming regresyonunun uygun bir çözüm verdiğini göstereceğini düşünüyorum. Katılıyor musun?
Müşterinin talebini karşılamak için belirsiz bir şekilde tanımlanan talep edilen bootstrap analizini yapmam gerekiyor. Etik olarak sadece bootstrap sağlamanın yanlış olacağını düşünüyorum çünkü müşterinin gerçek problemini gerçekten çözmez, bu da test ölçüm prosedürünü haklı çıkarır. Bu yüzden onlara hem analizler vereceğim hem de en azından FDA'ya bootstrap yapmanın yanı sıra ters regresyon yaptığımı ve daha uygun olduğunu düşündüğüm Deming regresyonlarını sınırladığını söylemelerini isteyeceğim. Ayrıca, analizin yöntemlerinin referansa eşdeğer olduğunu ve Deming regresyonunun da yeterli olduğunu göstereceğini düşünüyorum.
Deming regresyonunu önyüklemem için @whuber'ın cevabında önerdiği R programını kullanmayı planlıyorum. R'ye çok aşina değilim ama bence yapabilirim. R Studio ile birlikte R yükledim. Bu benim gibi bir acemi için yeterince kolay olacak mı?
Ayrıca SAS var ve SAS daha rahat programlama. Herkes SAS bunu yapmanın bir yolunu biliyorsa, ben bunu bilmek takdir ediyorum.