Uyum iyiliği testi: Anderson – Darling testi ve Cramér – von Mises kriteri hakkında soru


10

Anderson-Darling testine ve Cramér – von Mises kriterine geldiğimde , form iyiliği testleri için web sayfaları okuyorum .

Şimdiye kadar amacım var; Anderson – Darling testi ve Cramér – von Mises kriteri benzer görünüyor, sadece farklı bir ağırlıklandırma fonksiyonuna dayanıyor . Ayrıca Watson testi olarak adlandırılan Cramér – von Mises kriterinin bir varyantı var .w

Temelde burada iki sorum var

  1. Bu iki yöntemle ilgili pek çok Google sonucu yok; hala son teknoloji mi? veya daha iyi yaklaşımlarla mı değiştirildi?

    Shapiro – Wilk, Kolmogorov-Smirnov, Lilliefors ve Anderson-Darling testlerinin güç karşılaştırmaları hakkındaki bu makaleye göre , AD oldukça iyi performans gösteriyor; her zaman Lilliefors ve KS'den daha iyi ve normal dağılım için özel olarak tasarlanmış SW testine çok yakın.

  2. Bu testler için güven aralığı nedir?

    AD, CM ve Watson testleri için wiki sayfalarında tanımlanan test istatistikleri değişkenini gördüm, ancak güven aralığını bulamadım.

    KαK

Yanıtlar:


4

Uyum iyiliği için en son teknoloji yoktur (örneğin, genel alternatifler arasında hiçbir UMP testi mevcut olmayacaktır ve gerçekten hiçbir şey yaklaşmayacaktır - yüksek saygın omnibus testlerinin bile bazı durumlarda korkunç bir gücü vardır).

Genel olarak bir test istatistiği seçerken, o işte iyi olan bir test istatistiği tespit etmek ve kullanmak için en önemli sapma türlerini seçersiniz. Bazı testler, çok çeşitli ilginç alternatiflerde çok başarılıdır, bu da onları iyi varsayılan seçimler haline getirir, ancak bu onları "son teknoloji" yapmaz.

Anderson Darling hala çok popüler ve iyi bir nedeni var. Cramer-von Mises testi bu günlerde çok daha az kullanılıyor (sürprizim çünkü genellikle Kolmogorov-Smirnov'dan daha iyi, ancak Anderson-Darling'den daha basit - ve genellikle "ortadaki" farklılıklardan daha iyi bir güce sahip dağıtım)

Tüm bu testler bazı alternatiflere karşı önyargıdan muzdariptir ve Anderson-Darling'in diğer testlerden çok daha kötü (çok, gerçekten) olduğu durumları bulmak kolaydır. (Önerdiğim gibi, hepsine hükmedecek bir sınavdan çok 'kurslar için atlar'). Ne yazık ki, bu konuya çok az dikkat ediliyor (benim için en önemli sapmaları toplamanın en iyi yanı nedir?).

Bu yayınların bazılarında bir miktar değer bulabilirsiniz:

Shapiro – Wilk en iyi normallik testi midir? Neden Anderson-Darling gibi diğer testlerden daha iyi olabilir?

2 Örnek Kolmogorov-Smirnov vs. Anderson-Darling vs Cramer-von-Mises (yaklaşık iki örneklem testleri, ancak ifadelerin çoğu

Kolmogorov'un dağılımlar arasındaki mesafe için motivasyon (daha teorik tartışma, ancak pratik çıkarımlar hakkında birkaç önemli nokta var)


Cramer-von Mises ve Anderson Darline istatistiklerinde cdf için bir güven aralığı oluşturabileceğinizi sanmıyorum, çünkü kriterler en büyük değil tüm sapmalara dayanıyor.


"Eskimiş" bir kullanım anlamına gelen "son teknoloji" yi aldım. Çoklu uyum iyiliği tanımlarının varlığı bize uyum iyiliğinin tek bir kavram olmadığını göstermelidir. "İyi" nin "neden" regresyon yaptığımıza bağlı olduğunu düşünün. Diyelim ki C etkisi için en iyi öngörücüyü elde etmek için Model A'yı B verilerine bağladığımızı varsayalım. O zaman "iyi" C'nin B değil en iyi öngörücüsüdür. Ancak, çoğu zaman B ve C'nin nasıl farklı olduğu sorusu göz ardı edilir.
Carl

1
@Carl , genellikle en son teknolojinin ne anlama geldiğine dair bir sözlük (veya wikipedia) kontrol etmek isteyebilirsiniz - ifadeyi yorumlamanız çoğu insanın ifadeyi nasıl okuduğu değildir. Sözlükler şöyle şeyler söyler: " gelişimde en yeni aşama, en yeni fikirleri bir araya getirme " ve " belirli bir zamanda en yüksek düzeyde geliştirme " ve " en son teknolojiyi kullanarak son teknoloji ". Bu bağlamda - uyum iyiliğini test etmek - cümle "şu anda yapabileceğimiz en iyi şey" anlamına gelir. Bunun tek bir test hakkında söyleyebileceğin bir şey olmadığında ısrar ediyorum. ...
ctd

2
... örneğin, Shapiro-Wilk gibi popüler testlerin (normalliği test etmede çok popüler olmasına rağmen) daha iyi güce sahip rakipleri olduğunu söyleyebiliriz (örneğin, bkz. Shapiro & Chen 1995) - ama her durumda değil. Tek bir en iyi test seçeneği yoktur (ve dolayısıyla gerçek bir 'son teknoloji' yoktur). Kesinlikle en iyi olanın (son teknoloji) koşullara bağlı olduğunu kabul ediyorum --- bu benim cevabımın anlamı; olası cevaplar sayısızdır - bir durumda iyi bir şey diğerinde çok kötü olabilir. Testlerin ne zaman iyi performans gösterdiğini bilmek, tek bir şeymiş gibi "en iyi olanı" sormaktan daha iyidir.
Glen_b

Doğru, tanımınız daha doğru. Bununla birlikte, yöntem testlerinden çok daha fazla yöntem vardır ve "son teknoloji" büyük ölçüde kurgudur, yani, "sanat" ın kahramanı olduğu tek bir "durumu" yoktur. Böyle belirsiz bir pozitöre verilen herhangi bir cevap muğlaktır. 'Evet' dedim ve 'hayır' dediniz, ikimiz de aynı şeyi söyledik.
Carl

BTW, "eski ya da modası geçmiş" anlamına gelen "son teknoloji" ya da "değiştirildi" sorusuydu. Bu yüzden cevabım için bir bağlam vardı, "Lütfen 'en son teknoloji' ve 'değiştir' kelimelerinin zıt anlamlı olduğunu varsayalım ve lütfen bunlardan birini seçin. Bunların zıt anlamlı olmadığı konusunda haklısınız, bağlam içinde cevap veriyordum ve soruyu yalvarmayı seçtiniz. Yani, benimki kibar cevaptı. Ve cevabınız için oy kullanacağım, çünkü aşırı kibar olmasa da bilgilendirici olduğunu düşünüyorum.
Carl

2

n=400 Kolmogorov-Smirnov testinden daha güçlü bir kümülatif yoğunluk fonksiyonu uyum iyiliği testidir ve t testinden daha fazla veya daha az güce sahip olabilir. Ki-kare, düşük hücre sayımlarında zorluk çeker, bu nedenle kuyrukları takmak için aralık kısıtlamaları kullanılır.

** Soru 1: ... bu iki yöntem ... hala son teknoloji mi? veya daha iyi yaklaşımlarla mı değiştirildi? Soru 2 Bu tür testler için güven aralığı nedir? **

Cevap: Onlar en son teknolojidir. Ancak bazen olasılıklar değil güven aralıkları isteriz. Bu yöntemleri birbirleriyle karşılaştırırken güven aralıklarından ziyade güçten bahsediyoruz. Bazen uyum iyiliği AIC, BIC ve iyi uyum olasılığının aksine diğer kriterler kullanılarak analiz edilir ve bazen uyum iyiliği kriteri, örneğin uyum iyiliği uyum kriteri olmadığında önemsizdir. . İkinci durumda, regresyon hedefimiz, fitting ile ilgili olmayan fiziksel bir miktar olabilir, örneğin bkz. Tk-GV .


Not: Anderson-Darling testi Cramer-von Mises testinin ağırlıklı bir versiyonudur; & bunun gibi, herhangi bir sürekli dağıtım için uygundur.
Scortchi - Monica'yı eski durumuna döndürün
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.