Bir başkasının sonucuna göre istatistiksel bir test seçmek (örn. Normalite)


13

Bu yüzden, bir diğerinin sonucuna dayanarak bir istatistiksel test seçmenin iyi bir fikir olmadığını söylediğini duydum. Bu bana garip geliyor. Örneğin, insanlar diğer bazı testler artıkların normal olarak dağıtılmadığını öne sürdüğünde parametrik olmayan bir test kullanmayı tercih eder. Bu yaklaşım oldukça geniş kabul görüyor ancak bu paragraftaki ilk cümleyle aynı fikirde değil. Sadece bu konuda açıklama almayı umuyordum.


3
Kalıntıların Gauss olmaması, parametrik olmayan testlere ihtiyacınız olduğu anlamına gelmez. Genellikle kullanılacak modelin türünü (evet model, test değil) (sayım, 0 1 veri, sürekli, ortalama varyans ilişkisi, doğrusal veya doğrusal olmayan ilişki, vb.) Ve uygun modelleri uygun şekilde ayırt edebilirsiniz. daha önce test edilecek hipotezin ne olduğuna karar veren verilerin özelliklerini karşılamak. Uygunluğun, takılan modelin varsayımlarını karşıladığını hissettiğinde, p-değerini ve diğer istatistikleri değerlendirebilirsiniz,
Monica'yı yeniden eski haline getirin - G. Simpson

Yanıtlar:


14

Göz önüne alındığında verileri bu aşırı ya da eğer daha aşırı gözlemleme olasılığıdır doğrudur, o zaman yorumlanması nedir üretilen testin seçiminde yapılan bir şarta karar vardı bir süreç yoluyla ulaşılır bu ? Cevap bilinemez (veya en azından neredeyse neredeyse bilinemez). Testi yürütme kararı alıp almamaya karar vererek, sonuçlarınızın yorumlanmasını daha da karmaşık hale getirdiniz. H 0 p p p p ppH0ppppNumune boyutu ve analiz planı önceden tamamen seçildiğinde değerler maksimum düzeyde yorumlanabilir. Diğer durumlarda, yorumlar zorlaşır, bu yüzden 'iyi bir fikir değildir'. Bununla birlikte, yaygın olarak kabul gören bir uygulamadır ... sonuçta, çalıştırmayı planladığınız testin geçersiz olduğunu tespit ederseniz neden bir test yapmak için uğraşasınız ki? Bu sorunun cevabı çok daha az kesindir. Tüm bunlar, sıfır hipotez anlamlılık testinin ( birincil kullanım durumu ) aşılması zor bazı problemlere sahip olduğu gerçeğine dayanmaktadır .p


Muhtemelen yanlış arama terimlerini kullandığım için Google'da bu fenomeni tartışan hiçbir makale bulamadım. Birisi beni testlere dayalı test problemini tartışan bir makaleye yönlendirebilir mi?
Rob Hall

1
@RHHHall: Bu "Hayali veriler için varsayımsal sorunların önemi" nin özel bir örneğidir. Krş Wagenmakers, 2007, s. 784. Wagenmakers özellikle ikinci sütundaki dönüşümler sorununa dikkat çekerek "ap değerini hesaplamak için, veriler farklı çıksaydı ne yapacağınızı bilmeniz gerekir ... normalde normal olarak dağılmamışsa ..., p değerleri ancak örnekleme planı tamamen bilinip önceden belirtildikten sonra hesaplanabilir ".
russellpierce

8

Örneğin, insanlar diğer bazı testler artıkların normal olarak dağıtılmadığını öne sürdüğünde parametrik olmayan bir test kullanmayı tercih eder. Bu yaklaşım oldukça geniş kabul görüyor ancak bu paragraftaki ilk cümleyle aynı fikirde değil. Sadece bu konuda açıklama almayı umuyordum.

Evet, birçok insan bu tür bir şey yapar ve ikinci testlerini varyans eşitliğini reddettiklerinde heteroskedastisite ile başa çıkabilecek bir testle değiştirir.

Bir şey yaygın olduğu için mutlaka akıllıca olduğu anlamına gelmez.

Gerçekten de, bazı yerlerde (en kötü rahatsız edici disiplinleri adlandırmayacağım), diğer resmi hipotez testlerine bağlı olan bu resmi hipotez testinin çoğu aslında öğretilmektedir.

Bunu yapmanın sorunu, prosedürlerinizin nominal özelliklerine sahip olmaması, hatta bazen yakın olmamasıdır. (Öte yandan, potansiyel olarak aşırı ihlal için hiç dikkate alınmadan böyle şeyleri varsaymak daha da kötü olabilir.)

Birkaç makale, heteroskedastik vaka için, varyansların test etmek ve sadece reddetme hakkında bir şeyler yapmaktan daha az gibi davranmaktan daha iyi olduğunu düşünüyoruz.

Normallik durumunda daha az açıktır. En azından büyük örneklerde, çoğu durumda normallik o kadar önemli değildir (ancak ironik olarak, büyük örneklerle, normallik testinizin reddedilmesi çok daha olasıdır), normal olmayanlık çok vahşi olmadığı sürece. Bunun bir istisnası, dağıtım varsayımınızın sağa yakın olması için gerçekten ihtiyaç duyduğunuz tahmin aralıklarıdır.

Kısmen, bir problem hipotez testlerinin cevaplanması gerekenden farklı bir soruyu cevaplamasıdır. Gerçekten bilmek gerekmez 'veri gerçekten normaldir' (hemen hemen her zaman, tam olarak normale olmayacak önsel bir ). Soru daha ziyade 'normallik dışılığın kapsamı çıkarımımı ne kadar kötü etkileyecektir'.

İkinci konu genellikle ya örnek büyüklüğünden bağımsızdır ya da artan örnek büyüklüğüyle daha iyi olur - ancak hipotez testleri neredeyse her zaman büyük örnek büyüklüklerinde reddedilir.

Normalde bile tamamen verimli çok yakın olan (ve muhtemelen oldukça mütevazı kalkışlarda potansiyel olarak çok daha verimli) sağlam veya hatta dağıtımsız prosedürlerin olduğu birçok durum vardır - çoğu durumda, aynı ihtiyatlı yaklaşım.


Nice (+1) Heteroskedastik dava hakkında bahsettiğiniz makalelere referans verebilir misiniz?
gui11aume

2
Herhangi bir şeyi işaret etmek istemiyorum, ancak her zaman çevrimiçi olarak karşılaşıyorum, bu yüzden hangilerini vurgulama eğiliminde olduğunu bulmak zor değil (bunlar, tarihsel olarak hipotez testini aşırı vurgulayanlarla aynı olma eğilimindedir). Afişler düşündüklerini Burada soruları üreten insanların Nitekim disiplinleri var genellikle aynı olanlar olacaktır biçimsel testlerin kullanılacağı. Bu sadece bir ya da iki disiplin değil - birçoğunu görüyorum - ama bazıları bunu sık sık yapıyor gibi görünüyor. Oldukça yaygın olması için, sadece ısrar eden bu alanlarda özellikle tanınmış metinler olduğunu varsayabilirim.
Glen_b-Monica

1
@ gui11aume İşte bir referans ... aradığımlardan biri değil, ama anladığım noktaya işaret ediyor (ön test işleri daha da kötüleştirebilir).
Glen_b

2
Andrew Gelman'ın son zamanlarda ilişkili gruplar arasındaki heterojenite (en azından böyle bir sürecin neden sorunlu olduğu hakkında) ile ilgili bir görevi vardı .
Andy W

1
Bir süre önce bu tartışmalarla ilgili bir soru: stats.stackexchange.com/questions/305/…
russellpierce

8

Ana konular başkaları tarafından iyi açıklanmıştır, ancak altta yatan veya ilişkili olan

  1. P değerleri için aşırı saygı, istatistiklerde en az bir tür kanıt.

  2. İstatistiksel raporların kaçınılmaz olarak, bazıları kesin olarak kanıta dayalı, bazıları daha önceki analizlerin, sezgi, tahmin, yargı, teori vb. Bir karışımına dayanan bir seçim kombinasyonuna dayandığını görmekte isteksizlik.

Diyelim ki ben ve temkinli arkadaşım Test Her şey bir yanıt için bir günlük dönüşümü seçti, ancak bu sonuca fiziksel akıl yürütme ve veri ile önceki deneyimlerin bir karışımını temel alarak atlarım, Test Everything ise Box-Cox testi ve tahminine dayanarak günlük ölçeğini seçti bir parametrenin.

Şimdi ikimiz de aynı çoklu regresyonu kullanıyoruz. P-değerlerimizin farklı yorumları var mı? Bir yorumda, Test Everything'ın P değerleri önceki çıkarımlarına bağlıdır. Ben de çıkarımlar kullandım, ancak çoğunlukla önceki projelerde uzun bir geçmiş grafik, hesaplamalar vb. Bu nasıl rapor edilecek?

Doğal olarak, regresyon sonuçları Test Everything ve kendim için tamamen aynıdır.

Aynı mantıklı tavsiye ve şüpheli felsefe karışımı, öngörücülerin seçimi ve fonksiyonel form için de geçerlidir. Örneğin iktisatçılara, önceki teorik tartışmalara saygı göstermeleri ve her durumda iyi bir sebeple veri gözetlemelerine karşı dikkatli olmaları öğretilir. Ancak en zayıf durumlarda, ilgili teori, daha önce literatürde, muhtemelen bazı ampirik analizlerden sonra yapılan geçici bir öneridir. Ancak literatür referansları, eldeki verilerden öğrenmek şüpheli olsa da, birçok yazar için kutsaldır.


Çok açık (+1).
gui11aume

1
+1. Bununla birlikte, analizlerinizin performansında Test Everything'ın analizlerine kıyasla uzun vadeli bir fark vardır. Bu analiz her çalıştırıldığında, literatürde yazılanlara dayanarak aynı stratejiyi kullanacaksınız (deney deneyi dalgalandırmaz). OTOH veriler olan gelişigüzel bir örnek, ve çalışma ile çalışma dalgalanma Box-Cox test çıktısı.
gung - Monica'yı eski durumuna döndürün

Bu droll, ama benim deneyimim de değişiyor, uzun vadede.
Nick Cox
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.