Sayımın standart hatası


14

Nadir bir hastalığın mevsimine göre olay vakaları veri kümem var. Örneğin, ilkbaharda 180, yazın 90, sonbaharda 45 ve kış aylarında 210 vaka olduğunu varsayalım. Bu sayılara standart hatalar eklemenin uygun olup olmadığı konusunda mücadele ediyorum. Araştırma hedefleri, gelecekte tekrarlayabilecek hastalık insidansında mevsimsel bir model aradığımız anlamında yetersizdir. Böylece, sezgisel olarak, toplamlara bir belirsizlik ölçüsü eklemek mümkün olmalıdır. Ancak, örneğin, araçlar veya oranlar yerine basit sayımlarla uğraştığımızdan, bu durumda standart bir hatayı nasıl hesaplayacağından emin değilim.

Son olarak, cevap, verilerin vaka popülasyonunu (daha önce meydana gelen her vaka) mı yoksa rastgele bir örneği mi temsil ettiğine bağlı mı? Yanılmıyorsam, sonuçta nüfus istatistikleri ile standart hatalar sunmak mantıklı değildir, çünkü çıkarım yoktur.


Sayım sadece normal olmayan orantıdır, böylece st'yi hesaplayabilirsiniz. orantı hatası ve sizin için bir anlam ifade ediyorsa, sayım birimlerine "normalleştirmeyin". Haklısın st. hata yalnızca örnek için geçerlidir. Popülasyonda hata yoktur.
ttnphns

Yanıtlar:


14

Nüfus, hastalığa yakalanma riski taşıyan tüm insanların (varsayımsal) kümesidir; genellikle, bu çalışma alanında yaşayan tüm insanlardan (veya açıkça tanımlanabilir bazı alt gruplardan) oluşur. Bu popülasyonu açık bir şekilde tanımlamak önemlidir, çünkü çalışmanın ve verilerden yapılan tüm çıkarımların hedefi budur.

Hastalık vakaları bağımsız olduğunda (hastalık insanlar arasında kolayca iletilmediğinde ve yerel çevre koşullarından kaynaklanmadığında makul bir hipotez olabilir) ve nadir olduklarında, sayımlar bir Poisson dağılımını yakından takip etmelidir . Bu dağılım için, standart sapmasının iyi bir tahmini sayımın kare köküdür .

(180,90,45,210)(13.4,9.5,6.7,14.5)bir mevsimde gözlemlenen gerçek hastalık sayısı, o gerçek orandan farklı olacaktır. Gerçek (ancak bilinmeyen!) Oranın karekökü oluşması muhtemel varyasyon miktarını belirler. Çünkü gözlemlenen sayımları gerektiğini yakın gerçek oranlara olmak, onların karekök gerçek oranlarının kare kökleri için makul proxy olmalıdır. Bu proxy'ler tam olarak bir "standart hata" ile kastedilmektedir.

1657714.577

9(20,10,5,23)(4.5,3.2,2.2,4.8)9(40,28.5,20,44)

Bu sınırlı verilerle gidilebilecek kadarıyla ilgili. Bu basit hesaplamalar şunları ortaya koydu:

  • Nüfusun tanımlanması önemlidir,

  • Bir sayımın kare kökü, standart hatasını değerlendirmek için kaba bir başlangıç ​​noktasıdır,

  • Kare kök, hastalık vakalarında bağımsızlık eksikliğini yansıtmak için bazı faktörlerle (kabaca) çarpılmalıdır (ve bu faktör yaklaşık olarak hastalık kümelerinin boyutları ile ilişkili olabilir),

  • Bu sayımlar arasındaki varyasyon öncelikle belirsizlikten ziyade (altta yatan Poisson yoğunluğu hakkında) hastalık oranındaki zaman içindeki değişimi yansıtır.


1
Çok düşünceli, kapsamlı bir cevap! Çok teşekkürler.
yarı geçiş

2

"Neyin standart hatası?" Diye sorduğumda hüzünlü değilim. Bu dört rakamın ortalamasını alabilir ve bu ortalamanın standart hatasını hesaplayabilirsiniz. Bu istatistik ve bunun sonucunda ortaya çıkan bir güven aralığı, bu 4 mevsimi genelleştirebileceğiniz 4 mevsimi temsil eden bir grup olarak ele almanın haklı olduğuna inanıyorsanız mantıklı olacaktır. Haklı olduğunuz ölçüde, sahip olduğunuz veriler popülasyonun rastgele bir örneği olacaktır. Bahsettiğiniz örnekleme ek bir örnekleme katmanı gerektirecektir - buna her yıl bir küme oluşturduğu küme örnekleme diyebilirsiniz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.