Bu soru, istatistiklerin ne olduğu ve iyi bir istatistiksel analizin nasıl yapılacağı ile ilgilidir. Bazıları terminoloji ve diğerleri de teori gibi birçok konuyu gündeme getiriyor. Onları açıklığa kavuşturmak için, sorunun örtük bağlamına dikkat ederek başlayalım ve oradan devam ederek "parametre," "özellik" ve "tahmincisi" anahtar terimlerini tanımlayın. Sorunun birkaç kısmı tartışmada ortaya çıktıkça cevaplanır. Son sonuç bölümü temel fikirleri özetler.
Durum uzayları
Exp ile orantılı PDF ile Normal dağılım "dağıtım," yaygın bir istatistiksel kullanımı ( - 1"aslında İngilizce'nin (ciddi) kötüye kullanılmasıdır, çünkü açıkçası bu tek bir dağılım değildir:μveσsembolleri ileparametreleştirilmişbütün bir dağılım ailesi. bu "durum alanı"Ω, birdizitecrübe( - 12( x - μ ) / σ)2) dxμσΩdağılımları. (Burada fuar uğruna biraz sadeleştiriyorum ve ilerledikçe sadeleştirmeye devam ederken, mümkün olduğunca titiz kalmaya devam ediyorum.) Rolü, istatistiksel prosedürlerimizin olası hedeflerini tanımlamaktır: bir şeyi tahmin ettiğimizde, bir (ya da bazen daha fazla) unsurları çekme .Ω
Bazen durum uzayları . Bu açıklamada , üst yarım düzlemdeki tuples kümesi { ( μ , σ ) } ile verilerimizi modellemek için kullanacağımız dağılımlar kümesi arasında bire bir yazışma bulunmaktadır . Böyle bir parametreleştirmenin bir değeri, şimdi düzenli bir şekilde bir çift gerçek sayı vasıtasıyla Ω cinsinden dağılımlara atıfta bulunabilmemizdir .Ω={N(μ,σ2)|μ∈R,σ>0}{(μ,σ)}Ω
Diğer durumlarda durum uzayları açıkça parametrelendirilmez. Bir örnek, tüm tek-modlu sürekli dağılımların kümesidir. Aşağıda, bu gibi durumlarda yeterli bir parametrelendirmenin bulunup bulunamayacağı sorusunu ele alacağız.
parametrizasyonlari
Genel olarak, bir parametreleştirme bir bir yazışma (matematiksel bir işlevi bir alt kümesinden) R, d ile ( d için sonlu) Q . Yani, dağıtımları etiketlemek için sıralı d- kümeleri kullanır . Ama bu sadece bir yazışma değil: “iyi davranılması” gerekiyor. Bunu anlamak için, PDF'leri sınırlı beklentileri olan tüm sürekli dağılımları düşünün. Bu, bu seti parametreleştirmek için herhangi bir "doğal" girişimin gerçek sayıların sayılabilir bir sekansını içereceği anlamında (parametrik olmayan bir genişleme kullanarak) yaygın olarak "parametrik olmayan" olarak kabul edilecektir. Bununla birlikte, bu setin kardinalitesi olduğu için ℵΩRddΩd , gerçeklerin temel özelliği olan bu dağılımlar ve R arasında birebir yazışmalar olmalıdır. Paradoksal olarak, bu bunutek birgerçek parametreyleparametreli birdurum alanı yapıyorgibi görünüyor!ℵ1R
Paradoks, tek bir gerçek sayının dağılımlarla "hoş" bir ilişkiden yararlanamayacağına dikkat çekerek çözülür: bu sayının değerini değiştirdiğimizde, karşılık gelen dağılım bazı durumlarda radikal yollarla değişmelidir. Bu tür "patolojik" parametreleştirmeleri, parametrelerinin yakın değerlerine karşılık gelen dağılımların kendilerinin "yakın" olmasını zorunlu kılarak ortadan kaldırıyoruz. "Kapat" ın uygun tanımlarını tartışmak bizi çok uzağa götürür, ancak umarım bu açıklama bir parametre olmak için belirli bir dağılımı adlandırmaktan çok daha fazlası olduğunu göstermek için yeterlidir.
Dağılımların özellikleri
ΩΩΩΩt1Ω
Özellikler her zaman parametre değildir
Bir özellik, parametre olarak işlev görmeyecek kadar karmaşık bir işlev olabilir. "Normal dağılım" durumunu düşünün. En yakın tam sayıya yuvarlandığında gerçek dağılımın ortalamasının eşit olup olmadığını bilmek isteyebiliriz. Bu bir özellik. Ancak parametre olarak işlev görmez.
Parametreler mutlaka özellik değildir
Parametreler ve dağılımlar bire bir yazışma olduğunda, açıkçası herhangi bir parametre ve bu konudaki parametrelerin herhangi bir işlevi, tanımımıza göre bir özelliktir. Ancak parametreler ve dağılımlar arasında birebir yazışmalara gerek yoktur: bazen birkaç dağılım, parametrelerin iki veya daha fazla farklı farklı değerleri ile tanımlanmalıdır. Örneğin, küre üzerindeki noktalar için bir konum parametresi doğal olarak enlem ve boylam kullanır. Bu iyi - verilen bir enlem ve herhangi bir geçerli boylama karşılık gelen iki kutup hariç . konum(küre üzerindeki nokta) gerçekten bir özelliktir, ancak boylamı mutlaka bir özellik değildir. Her ne kadar çeşitli kaçışlar olsa da (örneğin yalnızca bir kutbun boylamını sıfır olarak bildirin), bu sorun bir özellik (bir dağıtımla benzersiz bir şekilde ilişkilidir) ve bir parametre (bir etiketleme yolu ) arasındaki önemli kavramsal farkı vurgular. ve benzersiz olmayabilir).
İstatistiksel prosedürler
Bir tahmin hedef bir denir estimand . Sadece bir özelliktir. İstatistikçi tahmini seçmekte özgür değildir : müşterinin ilidir. Birisi size bir nüfus örneği ile geldiğinde ve nüfusun 99. yüzdelik dilimini tahmin etmenizi istediğinde, bunun yerine muhtemelen ortalamanın bir tahmincisini sağlamanızdan memnun olacaksınız! İstatistikçi olarak işiniz, size verilen tahmini tahmin etmek için iyi bir prosedür belirlemektir . (Bazen işiniz, müşterinizi bilimsel hedefleri için yanlış tahmin seçtiği konusunda ikna etmektir, ancak bu farklı bir konudur ...)
Ω
Kestirimciler
ΩΩ
tθ F∈ΩFst(s)θ(F)Ft(s)θ(F)FΩ
F∈Ωt1tt
(Bir "Bayesci" istatistikçi her zaman olası durumların (genellikle müşteri tarafından sağlanır) "önceki" dağılımı üzerinden ortalamaları karşılaştırarak riskleri karşılaştıracaktır. riskleri Bayeslilerden kaçınmak.
Sonuçlar
tθθtθθ
Ωt