Ölçüm Belirsizliğini İçeren İstatistiksel Testler


11

Y1 ve y2 olarak adlandırılan iki grup kütle ölçümü (mg cinsinden) verildiğini varsayalım. İki numunenin farklı yollardan popülasyonlardan çekilip çizilmediğini belirlemek için bir test yapmak istiyorum. Örneğin böyle bir şey (R cinsinden):

y1 <- c(10.5,2.9,2.0,4.4,2.8,5.9,4.2,2.7,4.7,6.6)
y2 <- c(3.8,4.3,2.8,5.0,9.3,6.0,7.6,3.8,6.8,7.9)
t.test(y1,y2)

0.3234'lük bir p değeri elde ediyorum ve 0.05'lik anlamlılık düzeyinde, iki grubun aynı ortalamaya sahip popülasyonlardan alındığı sıfır hipotezini reddetmiyorum. Şimdi her ölçüm için belirsizlikler veriliyor:

u1 <- c(2.3,1.7,1.7,1.7,2.0,2.2,2.1,1.7,2.3,2.2)
u2 <- c(2.4,1.8,1.6,2.3,2.5,1.8,1.9,1.5,2.3,2.3)

burada u1 [1], y1 [1] (ve benzeri) ölçümlerinde birleştirilmiş standart belirsizliktir. Bu belirsizlikleri istatistiksel teste nasıl dahil edebilirim?


Bu eşleştirilmiş ölçümler var mı değil mi? (Sanmıyorum.) Belirsizlikler, çıkarımınızı artırabilecek ağırlıklar elde etmek için kullanılabilir, ancak belirsizliklerdeki değişiklik oldukça küçüktür, bu nedenle belirsizliklerde bile çok fazla kazanç olmayacaktır.
Glen_b-Monica'yı geri

Bunlar, gerçek eşleştirilmemiş verilerin bir alt kümesidir. Örnek öncelikle soruyu açıklığa kavuşturmaktı. Gerçekten aradığım şey, ölçüm belirsizliğinin bir hipotez testine (testte olduğu gibi) en iyi şekilde nasıl dahil edileceğine dair genel rehberliktir. Bana öyle geliyor ki, ölçüm belirsizliğini kullanmazsak çok değerli bilgiler harcıyoruz, ancak literatürde bu konuda net bir rehber bulamadım.
Tom

Bunlardan en iyi şekilde yararlanmak için, bunları gözlemler için olasılıksal bir modele dahil etmeniz gerekir; ölçüm belirsizlikleri gerçekte neyi temsil eder? (Bunu el sıkıştıramazsınız, bu yüzden dikkatli olun.)
Glen_b-Monica'yı

Yanıtlar:


1

Bu, ağırlıklı bir analiz yapmak istediğiniz gibi geliyor. SAS belgelerinin "Kavramlar" bölümündeki "Ağırlıklı İstatistik Örneği" konusuna bakın .


Bu yüzden sadece t-testini ağırlıklı araçlar ve ağırlıklı standart sapmalarla yapıyoruz, u1 ve u1 ağırlıklar nerede?
Tom

Evet. İ_th gözleminin varyansının Var / w_i olduğunu varsayarsınız; burada w_i i_th gözlemi ve Var> 0 için ağırlıktır.
Rick,

1

Neden simüle etmiyorsun? Yani, her gözlemde gürültünün gerçekleşmesi olarak belirsizliğinizi ekleyin. Sonra hipotez testini tekrarlayın. Bunu yaklaşık 1000 kez yapın ve null değerinin kaç kez reddedildiğini görün. Gürültü için bir dağıtım seçmeniz gerekecek. Normal bir seçenek gibi görünür, ancak gerçekçi olmayan negatif gözlemler üretebilir.


1

Bunu bir regresyon problemine dönüştürebilir ve belirsizlikleri ağırlık olarak kullanabilirsiniz. Yani, bir regresyondaki ölçümden grubu (1 veya 2?) Tahmin edin.

Fakat

Belirsizlikler yaklaşık olarak sabittir, bu yüzden bunları kullanarak çok fazla bir şey değişmeyebilir.

10.5'te hafif bir aykırı değer var, bu da araçlar arasındaki farkı azaltarak işleri karmaşıklaştırıyor. Ancak belirsizliklere inanabiliyorsanız, bu değer diğerlerinden daha şüpheli değildir.

T-testi, alternatif hipotezinizin farklı popülasyonlardan iki örnek alındığı anlamına gelmez. Tek bildiği, belli varsayımlar altında araçları karşılaştırmaktır. Sıra tabanlı testler bir alternatiftir, ancak bu verilerle ölçüm olarak ilgileniyorsanız, hedefleriniz için tercih edilmezler.


Alınan nokta. Soruyu araçlar açısından ifade etmek için değiştirdim.
Tom

0

Sıradan en küçük karelerde (örneğin, lm (y ~ x)), x değeri verildiğinde y değerleri etrafında değişkenliğe (belirsizlik) izin verirsiniz. Regresyonu ters çevirirseniz (lm (x ~)) x etrafındaki hataları en aza indirirsiniz. Her iki durumda da, hataların oldukça homojen olduğu varsayılmaktadır.

Yanıt değişkeninizin her bir gözleminin etrafındaki varyans miktarını biliyorsanız ve x tarafından sipariş edildiğinde bu varyans sabit değilse, en az ağırlıklı kareler kullanmak istersiniz. Y değerlerini 1 / (varyans) faktörlerine göre ağırlıklandırabilirsiniz.

Hem x hem de y'nin belirsizliğe sahip olduğundan ve bu belirsizliğin ikisi arasında aynı olmadığından endişe duyduğunuz durumda, sadece eksenlerinizden birine dik olan kalıntıları (adres belirsizliğini) en aza indirmek istemezsiniz. İdeal olarak, yerleştirilmiş trend çizgisine dik olan belirsizliği en aza indirirsiniz. Bunu yapmak için, PCA regresyon kullanabilirsiniz (de vardır. Ortogonal regresyon veya toplam en az kareler olarak bilinen PCA regresyon R paketleri ve orada var daha önce bu web sitesinde bu konuyla ilgili mesajlar olmuştur , daha sonra da başka bir yerde tartışılmıştır Dahası, sanırım (yani, yanlış olabilirim ...) yine de bu gerilemenin ağırlıklı bir versiyonunu yapabilir ve varyanslar hakkındaki bilginizi kullanabilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.