Ölçüm hatasına göre öncelikleri seçme


9

Bir enstrümanın ölçüm hatası varsa uygun olanı nasıl hesaplarsınız? Bu paragraf Cressie'nin "Mekansal-Geçici Veriler için İstatistikler" kitabından alınmıştır:

Genellikle, ölçüm-hata varyansı ile ilgili olarak, oldukça bilgilendirici bir parametre modelinin belirlenmesine izin veren bazı önceden bilgilerin mevcut olması söz konusudur. Örneğin, şartlı olarak bağımsız ölçüm hatalarını varsayarsak G,biru(0,σε2), daha önce σε2. Ortam hava sıcaklığı ile ilgilendiğimizi ve cihaz üreticisinin spesifikasyonlarının bir “hata” gösterdiğini gördük . Bu "hatanın" 2 standart sapmaya (kontrol edilmesi gereken bir varsayım!) Karşılık geldiği varsayılırsa, daha önce olması için belirtebiliriz.±0.1°Cσε2(0.1/2)2=0.0025. Enstrüman üreticisinin spesifikasyonu nedeniyle, 0.0025'te net bir şekilde tanımlanmış ve oldukça dar bir zirveye sahip bir dağılım olduğunu varsayarız (örneğin, ters gama). Aslında, sadece 0.0025 olarak sabitleyebiliriz; bununla birlikte, veri modeli hatası diğer belirsizlik bileşenlerine de sahip olabilir (Bölüm 7.1). Süreç modeli hatası ile olası tanımlanabilirlik sorunlarından kaçınmak için, modelcilerin çoğaltılmış verilere sahip olacak şekilde tasarlanmış yan çalışmalar yapmak da dahil olmak üzere belirsizliği Bilimin izin verdiği ölçüde azaltması çok önemlidir.

Yukarıda açıklanan bir öncekinin değerlerini elde etmek için genel prosedürün ne olduğunu bilen var mı (paragraf sadece önceki ortalamanın elde edilmesine atıfta bulunmasına rağmen)?

Yanıtlar:


6

İki standart yöntem vardır

  1. Teklifte belirtildiği gibi "alet üreticisinin teknik özelliklerine" bakın . Bu genellikle başka hiçbir bilgi olmadığında kullanılacak kaba bir geri dönüştür, çünkü (a) alet üreticisinin "doğruluk" ve "hassasiyet" ile gerçekten ne anlama geldiği genellikle belirsizdir ve (b) bir test laboratuarı, sahada kullanıldığında gerçekleştirilenden çok daha iyiydi.

  2. Yinelenen örnekleri toplayın. Çevresel örneklemede, örneklerin rutin olarak kopyalandığı (ve çoğunun çoğaltılabileceği) yaklaşık yarım düzine seviye vardır, her seviye atanabilir bir varyasyon kaynağını kontrol etmek için kullanılır. Bu tür kaynaklar şunları içerebilir:

    • Örneği alan kişinin kimliği.
    • Balyalama kuyuları gibi ön prosedürler numune almadan önce alınır.
    • Fiziksel örnekleme işleminde değişkenlik.
    • Örnek hacminin içindeki heterojenite.
    • Bir numuneyi saklarken ve bir laboratuvara gönderirken meydana gelebilecek değişiklikler.
    • Fiziksel bir numunenin homojenleştirilmesi veya analiz için sindirilmesi gibi ön laboratuvar prosedürlerindeki değişiklikler.
    • Laboratuvar analist (ler) inin tanımlanması.
    • Laboratuvarlar arasındaki farklar.
    • İki gaz kromatografisi gibi fiziksel olarak farklı enstrümanlar arasındaki farklar.
    • Zamanla cihaz kalibrasyonunda sapma.
    • Günlük değişim. (Bu doğal ve sistematik olabilir ancak örnekleme zamanları keyfi olduğunda rastgele görünebilir.)

Değişkenlik bileşenlerinin tam kantitatif değerlendirmesi, ancak bu faktörlerin her birinin uygun bir deneysel tasarıma göre sistematik olarak değiştirilmesiyle elde edilebilir.

Genellikle sadece en fazla değişkenliğe katkıda bulunduğuna inanılan kaynaklar incelenir. Örneğin, birçok çalışma numunelerin belli bir bölümünü alındıktan sonra sistematik olarak böler ve iki farklı laboratuvara gönderir. Bu bölünmelerin sonuçları arasındaki farkların araştırılması, ölçüm değişkenliğine katkılarını ölçebilir. Bu tür yeterli bölünmeler elde edilirse, ölçüm değişkenliğinin tam dağılımı, bir hiyerarşik Bayes uzaysal-temporal modelinde bir önceki gibi tahmin edilebilir. Çünkü Gauss dağılımlarını (hesaplamaların her biri için) üstlenen birçok model, önceden bir Gauss elde etmek, bölünmeler arasındaki farkların ortalamasını ve varyansını tahmin etmeye gelir. Varyansın birden fazla bileşenini tanımlamayı amaçlayan daha karmaşık çalışmalarda,

Bu konuları düşünmenin bile faydalarından biri, bu hata bileşenlerinden bazılarını azaltmaya veya hatta ortadan kaldırmanın yollarını tanımlamanıza yardımcı olmalarıdır (bunları ölçmek zorunda kalmadan), böylece Cressie & Wikle'ın "belirsizliği azaltma" idealine yaklaşmaktır. bilimin izin verdiği ölçüde. "

Uzun süreli işlenmiş bir örnek için (toprak örneklemesinde) bkz.

Van Ee, Blume ve Starks, Toprak Örneklemesinde Hataların Değerlendirilmesinin Gerekçesi. ABD EPA, Mayıs 1990: EPA / 600 / 4-90 / 013.


2
Buradaki mesele Robert, bazen birinin tahmin için standart bir sapma rapor edeceği; diğer zamanlarda iki kez (iki bölüme ayrıldığını) veya iki taraflı bir güven aralığını rapor edeceklerdir; ve bazen başka bir şey bile; böylece priors içine doğruluk ve hassasiyet ifadeleri dönüştürmek için kesin bir kural var: Eğer gereken sayıların gösterdiği tam olarak ne olduğunu anlamaya dipnotlar ve diğer teknik ayrıntıları danışın. Kullanılan tahminin büyüklüğünün bir fonksiyonu olan bir tahminin standart hatası, bu amaç BTW için önemsizdir.
whuber

1
Anladım. Odağı ikinci durumunuza değiştireyim. Bir denemeyi birkaç kez tekrarlar ve ölçüm alırsamm1 ve m2, bu bilgileri önceki bir dağıtımın ortalaması ve varyansı hakkında bilgilendirmek için nasıl kullanabilirim? Gibi bir şey önerdinm1-m2birkaç yarık için, değil mi? Bu nedenle, bir ölçüm hatası ortalaması alırdımmε ve bir örnek standart sapma σε. Öncekine dahil etmek yeterli mi?N-(mε,σε2)?
Robert Smith

1
Doğruluğu böler ile değerlendiremezsiniz: bunun için bilinen değerlerin örneklerini ölçmeniz gerekir. (Bunun için laboratuvar sivri uçları ve sivri uçlu kopyalar kullanılır.) Bu ortalamayı belirleyecektir. Genellikle bu, ölçüm işlemi kalibre edilirken ele alınır, bu nedenle ortalama sıfır olarak alınır. Varyans, olağan ANOVA formülleri ile tahmin edilir. Bunu, ölçüm sisteminin ilgili bileşeninde öncekini belirtmek için kullanabilirsiniz.
whuber

2
Öyle değil: Verdiğim referans, çeyrek asırdır var olan ABD EPA rehberliği ve fikirleri üzerine daha yeni rehberlik üzerine kuruluyor. Bir keresinde bu yaklaşımı bir federal mahkeme davasında, bir kirletici tüyün tanımlanması için çizilen kontur çizgileri (jeoistatistiksel bir öngörücüye dayanarak) üzerindeki etkisini değerlendirmek için kullandım: ölçüm hatası, tüyleri bağlamak için kullanılan konsantrasyondan daha büyüktü! (Başka bir deyişle, tüy tanımlamasındaki belirsizlik esasen sonsuzdu.)
whuber

1
Gerçekten hoş. Bu arada, önceliklerin genellikle çok dikkatli olmadan belirlendiğini söylemek istedim. Bunu Bayesci modelleme ve makine öğreniminde daha belirgin gördüm, çünkü bir tahmin genellikle iyi sonuçlar üretmek için yeterlidir.
Robert Smith
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.