Genel bir metodolojik sorum var. Daha önce cevaplanmış olabilir, ancak ilgili iş parçacığını bulamıyorum. Olası kopyalara işaret edecekleri takdir edeceğim.
( Burada . Ama hiçbir cevap, mükemmel bir tanesidir Bu bile bir cevap ile de ruhu içinde benzer, ancak ikincisi benim açımdan çok özeldir. Bu soruyu yazdıktan sonra keşfedilen yakın zamanda budur.)
Tema, verileri görmeden önce formüle edilen model veri oluşturma sürecini yeterince tanımlayamadığında geçerli istatistiksel çıkarımın nasıl yapılacağıdır . Soru çok genel, ama konuyu açıklamak için özel bir örnek sunacağım. Bununla birlikte, cevapların belirli örneğin ayrıntılarını nitelendirmekten ziyade genel metodolojik soruya odaklanmasını bekliyorum.
Somut bir örnek düşünün: bir zaman serisi ayarında, veri oluşturma sürecinin ile olduğunu . olan konu hipotezini test etmeyi amaçlıyorum . Konu konusundaki hipotezimin uygulanabilir bir istatistiksel karşılığı elde etmek için bunu model açısından kullandım ve bu Çok uzak çok iyi. Ancak verileri gözlemlediğimde, modelin verileri yeterince tanımlamadığını keşfediyorum. Diyelim ki doğrusal bir eğilim var, böylece gerçek veri oluşturma süreci ile
Konu hipotezim üzerinde nasıl geçerli istatistiksel çıkarım yapabilirim ?
Orijinal modeli kullanırsam, varsayımları ihlal edilir ve tahmincisi, aksi takdirde hoş bir dağılım göstermez. Bu nedenle, hipotezi testi ile test edemiyorum .
Verileri gördükten sonra, model den ' ye istatistiksel hipotezimi yerine , model varsayımları tatmin olur ve ben için iyi tahminci ve testini kullanarak zorluk test edebilirsiniz. Ancak, den
hipotezi test etmek istediğim veri seti tarafından bilgilendirilir. Bu, tahminci dağılımını (ve dolayısıyla çıkarımını), gözlemlenen verilerden kaynaklanan temel modeldeki değişime koşullu hale getirir. Açıkçası, bu şartlanmanın getirilmesi tatmin edici değildir.
İyi bir çıkış yolu var mı? (Sık sık değilse, belki Bayesian alternatifi?)