Neden birkaç (hepsi değilse de) parametrik hipotez testi rastgele örnekleme yapar?


12

Z, t ve diğerleri gibi testler, verilerin rastgele bir örneklemeye dayandığını varsayar. Neden?

İçsel geçerliliği dışsaldan çok daha fazla önemsediğim deneysel araştırma yaptığımı varsayalım. Yani, örneğim biraz önyargılı olabilirse, tamam, çünkü tüm popülasyonlar için hipotezi çıkarmamayı kabul ettim. Ve gruplama hala rastgele olacak, yani örnek katılımcıları rahatlık için seçeceğim, ancak bunları rastgele farklı gruplara atayacağım.

Neden bu varsayımı görmezden gelemiyorum?


Örnekleme tekniği bir yanlılık getirirse, 'rastgele' değildir. Herhangi bir önyargı getirmezse, o zaman 'rastgele' olur (rastgele bazı tanımlamalar için ;-). Sayaç örneğine uygun bir örnek boyutu oluşturmak için her 7. numuneyi alan örnekleme şemaları yaşadım. Bununla birlikte, bu seçimin özel bir yönü olmadığını biliyordum, bu yüzden rastgele olmayan bir örnekleme süreci olarak düşünülebilecek şey hala etkili bir şekilde rastgele idi. Çekilişte 1,2,3,4,5,6 topları seçmekle aynıdır. Diğer diziler gibi rastgele.
Philip Oakley

1
@PhilipOakley: çekilişte 1,2,3,4,5,6 topları seçmek, diğer tüm seçimlerle aynı kazanma şansını verir, ancak ödülü başkalarıyla paylaşma olasılığınız daha yüksek olduğu için beklenen kazançlarınızı azaltır. aynı fikri vardı
Henry

1
@Philip tarafından tarif edildiği gibi sistematik örnekleme, genellikle basit rastgele numuneler üretmiş gibi analiz edilir, ancak tuzakları vardır. Örneğin, her gün bir üretim sürecini ölçecek ve her yedinci ölçümü örnekleyecek olsaydınız, sonuçlarınızı haftanın günü etkisi ile karıştırmak zorunda kalacaksınız, çünkü (açıkçası) aynı günde numune alıyorsunuz her hafta. Rastgele olmayan örneklerle uğraşırken bu incelikleri düşünmek ve ele almak için daha fazla çalışmanız gerekir.
whuber

1
@whuber, Kesinlikle. Bu şeyler hakkında çok (ve yaygın) düşünmek gerekir !! Benim durumumda, yüzlerce olay, uzun boşluklar içeren saatlerce videom vardı, bu yüzden basit bir lojistik regresyon (her kare bağımsız olarak kabul edildi, çerçeveler arasında küçük bir değişiklik) için olay olmayan kümenin veri boyutunu azaltmak için gerekliydi, bu yüzden olay olmayan birçok kare bırakmak makul. Zaman sekansı yönü ayrı olarak değerlendirildi.
Philip Oakley

1
@Philip İlginçtir ki, rastlantısallık hakkında hemen hemen aynı anda bu yorumu yazıyordunuz, NIST bunun olduğunu iddia eden bir basın bülteni yayınladı . Nature'ın bugünün (4 Nisan 2018) sayısında bir hesap ortaya çıkıyor .
whuber

Yanıtlar:


18

Gerçek örneğinizden daha geniş bir grup için herhangi bir çıkarımda bulunmuyorsanız, ilk etapta istatistiksel testler uygulanmaz ve "yanlılık" sorusu ortaya çıkmaz. Bu durumda, sadece örnekleminizin bilinen istatistiklerini hesaplarsınız. Benzer şekilde, bu durumda "geçerlilik" modeli söz konusu değildir - sadece değişkenleri gözlemliyor ve değerlerini ve bu değerlerin yönlerinin açıklamalarını kaydediyorsunuz.

Bir kez daha büyük bir grup hakkında çıkarımlar yapmak için, numunenizin ötesine geçmeye karar verdiğinizde, o zaman istatistiklere ihtiyacınız olacak ve örnekleme önyargıları, vb. Gibi konuları göz önünde bulundurmanız gerekecektir. geniş ilgi grubunun çıkarımları. Rastgele örneklemeniz yoksa (ve örneklerinizin popülasyona dayalı olasılıklarını bilmiyorsanız), popülasyon hakkında güvenilir çıkarımlar yapmak zor / imkansız hale gelir.


5

Gerçek bilimsel araştırmalarda, gerçek rastgele örneklemeden elde edilen verilere sahip olmak oldukça nadirdir. Veriler neredeyse her zaman kolaylık örnekleridir. Bu öncelikle hangi popülasyona genelleme yapabileceğinizi etkiler. Bununla birlikte, bir kolaylık örneği olsalar bile, bir yerden gelmişlerdi, sadece bunun nerede ve sınırlamalarda olduğu konusunda net olmanız gerekir. Verilerinizin hiçbir şeyi temsil etmediğine gerçekten inanıyorsanız, çalışmanız herhangi bir düzeyde değerli olmayacaktır, ancak bu muhtemelen doğru değildir 1 . Bu nedenle, numunelerinizi bir yerden çekilmiş olarak değerlendirmek ve bu standart testleri en azından korunaklı veya nitelikli bir anlamda kullanmak genellikle mantıklıdır.

Bununla birlikte, bu varsayımlardan ve onlara dayanan testlerden uzaklaşmamız gerektiğini savunan farklı bir test felsefesi vardır. Tukey bunun savunucusuydu. Bunun yerine, çoğu deneysel araştırma (dahili olarak) geçerli kabul edilir, çünkü çalışma birimleri (örneğin hastalar) rastgele kollara atandı. Bu göz önüne alındığında, çoğunlukla sadece randomizasyonun doğru şekilde yapıldığını varsayan permütasyon testlerini kullanabilirsiniz . Bu konuda çok endişelenmenin karşıtı, permütasyon testlerinin tipik olarak karşılık gelen klasik testlerle aynı şeyi göstermesi ve daha fazla çalışma yapılmasıdır. Bu yüzden yine standart testler kabul edilebilir.

1. Bu satırlar boyunca daha fazla bilgi için, cevabımı burada okumak yardımcı olabilir: Bir çalışmada popülasyonu ve örnekleri belirlemek .


3

Z, t ve diğerleri gibi testler, ilgili istatistiklerin bilinen örnekleme dağılımlarına dayanmaktadır. Genellikle kullanılan bu örnekleme dağılımları, rastgele bir numuneden hesaplanan istatistik için tanımlanır.

Bazen rastgele olmayan örnekleme için ilgili bir örnekleme dağılımı tasarlamak mümkün olabilir, ancak genel olarak muhtemelen mümkün değildir.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.