Let Rasgele değişkenlerin bir dizinin bir gerçekleşme olduğu varsayılmaktadır gözlemlenmiş olması ortak olasılık yoğunluk fonksiyonu ile sigma-sonlu ölçü ile ilgili olarak tarif . yoğunluğuna Veri Üretme Süreci (DGP) yoğunluğu denir.y1,…,ynY1,…,Ynpeνpe
Araştırmacının olasılık modelinde
bir parametre vektörü tarafından endekslenen olasılık yoğunluk fonksiyonlarının bir koleksiyonudur
. içindeki her yoğunluğun ortak bir sigma-sonlu ölçüye göre tanımlanmış olduğunu varsayalım (örneğin, her yoğunluk aynı örnek uzay ile bir olasılık kütle fonksiyonu olabilir ).M≡{p(y;θ):θ∈Θ}θMνS
Verileri gerçekten oluşturan yoğunluğunu kavramsal olarak verilerin olasılık modelinden farklı tutmak önemlidir . Klasik istatistiksel tedavilerde bu kavramların dikkatlice ayrılması ya ihmal edilir, yapılmaz ya da en başından itibaren olasılık modelinin doğru bir şekilde belirtildiği varsayılır.pe
ile ilgili olarak doğru bir şekilde tanımlanmış modeli -neredeyse her yerde nin olduğu bir model olarak tanımlanır . Tüm
göre misspecified olduğu olasılık modeli doğru belirtilmezse durumda, bu karşılık gelir.Mpepe∈M νMpe
Olasılık modeli doğru belirtilirse, o zaman var olan bir parametre alanı şekilde
-neredeyse her. Böyle bir parametre vektörüne "gerçek parametre vektörü" denir. Olasılık modeli yanlış tanımlanmışsa, gerçek parametre vektörü mevcut değildir.θ∗Θpe(y)=p(y;θ∗) ν
White'ın model yanlış tanımlama çerçevesi içinde amaç, değerini en aza indiren
parametresini bulmaktır. miktar kompakt parametre alanı üzerinden . Benzersiz bir sıkı küresel minimizer, varsayılmaktadır , beklenen değerin üzerinde iç kısmında yer almaktadır . Olasılık modelinin doğru bir şekilde belirtildiği şanslı durumda, "gerçek parametre değeri" olarak yorumlanabilir.θ^nℓ^n(θ)≡(1/n)∑ni=1logp(yi;θ)Θθ∗ℓ^n ℓ nΘΘθ∗
Olasılık modelinin doğru bir şekilde belirtildiği özel durumda, tanıdık maksimum olabilirlik tahminidir. Olasılık modelinin doğru bir şekilde belirtildiğine dair mutlak bir bilgimiz yoksa, yarı maksimum olasılık tahmini denir ve hedef değerini tahmin etmektir . Şanslı olursak ve olasılık modeli doğru bir şekilde belirtilirse, yarı maksimum olabilirlik tahmini, bilinen maksimum olabilirlik tahminine özel bir durum olarak azalır ve
gerçek parametre değeri olur.θ^n θ nθ^nθ∗θ∗
Beyaz'ın (1982) çerçevesi içindeki tutarlılık , nın mutlaka gerçek parametre vektörü olmasını gerektirmeden ye yakınsamaya karşılık gelir . White çerçevesinde, by tarafından üretilen setlerin TRUE dağılımını P * içerme olasılığını asla tahmin edemeyiz. Bunun yerine, by tarafından üretilen setlerin yoğunluğu tarafından belirtilen dağılımı içermesi olasılığının olasılığı olan P ** olasılık dağılımını her zaman tahmin ederiz
.θ∗θ∗p(y;θ∗)
Son olarak, model yanlış tanımlaması hakkında birkaç yorum. Yanlış tanımlanmış bir modelin son derece yararlı ve çok öngörücü olduğu örnekler bulmak kolaydır. Örneğin, varyansı son derece küçük olmakla birlikte ortamdaki gerçek artık hata Gauss olmayan bir Gauss rezidüel hata terimi olan doğrusal olmayan (hatta lineer) bir regresyon modelini düşünün.
Doğru şekilde belirlenmiş bir modelin yararlı olmadığı ve öngörücü olmadığı örnekler bulmak da kolaydır. Örneğin, yarın kapanış fiyatının bugünkü kapanış fiyatının ve son derece büyük bir varyansa sahip bazı Gauss gürültüsünün ağırlıklı bir toplamı olduğunu tahmin eden hisse senedi fiyatlarını tahmin etmek için rastgele bir yürüyüş modeli düşünün.
Model yanlış tanımlama çerçevesinin amacı model geçerliliğini sağlamak değil, güvenilirliği sağlamaktır. Yani, parametre tahminlerinizle, güven aralıklarınızla, hipotez testlerinizle ve benzerlerinizle ilişkili örnekleme hatasının, küçük veya büyük miktarda model yanlış tanımlamasına rağmen doğru şekilde tahmin edildiğinden emin olun. Yarı-maksimum olabilirlik tahmin merkezli asimptotik normal bir kovaryans matrisi tahmin negatif log olasılık fonksiyonunun birinci ve ikinci türevleri hem bağlıdır ki. Şanslı olduğunuz ve modelin doğru olduğu özel durumda, tüm formüller, amacın "gerçek" parametre değerlerini tahmin etmek olduğu bilinen klasik istatistiksel çerçeveye indirgenir.θ∗