Aşağıdakileri, Sauro, J., & Lewis, JR (2016) 'nın s. Kullanıcı Deneyimini Ölçme: Kullanıcı Araştırması için Pratik İstatistikler, 2nd Ed. Cambridge, MA: Morgan-Kaufmann (içeride https://www.amazon.com/Quantifying-User-Experience-Second-Statistics/dp/0128023082/ adresinden bakabilirsiniz ).
EN SON 30 KULLANICIYLA TEST YAPMAYA İHTİYACINIZ VAR MI?
BİR ELİNDE
Muhtemelen, bir giriş istatistiği dersi alan (veya böyle bir dersi alan birini tanıyan) çoğumuz, tahmin etmek veya karşılaştırmak anlamına gelebilecek bir kural olduğunu duydum, örneklem büyüklüğünüz en az 30 olmalıdır. Merkezi limit teoremine göre, Numune büyüklüğü arttıkça, ortalamanın dağılımı, alttaki dağılımın normalliğinden bağımsız olarak daha da normal hale gelir. Bazı simülasyon çalışmaları, çok çeşitli dağılımlar için (ama hepsi değil - bkz. Bradley, 1978), ortalamanın dağılımının n = 30 olduğunda normale yakınlaştığını göstermiştir.
Diğer bir husus, z-puanları serbestlik derecelerinin kullanılmasını gerektirmediğinden, t-puanları yerine z-puanlarını kullanmanın biraz daha basit olmasıdır. Tablo 9.1 ve Şekil 9.2'de gösterildiği gibi, yaklaşık 30 serbestlik dereceniz olduğunda, t değeri z değerine oldukça yaklaşır. Sonuç olarak, küçük örneklem istatistiği gerektiren küçük örneklerle uğraşmak zorunda olmadığınızı hissedebilirsiniz (Cohen, 1990). ...
DİĞER YANDAN
Bir numunenin maliyeti pahalı olduğu zaman, tipik olarak birçok kullanıcı araştırması türünde olduğu gibi (örneğin, modüle edilmiş kullanılabilirlik testi), gerekli numune boyutunu mümkün olduğu kadar doğru bir şekilde tahmin etmek önemlidir. Belirli bir koşul kümesi için 30'un tam olarak doğru örnek olma olasılığı çok düşüktür. Örneklem büyüklüğü tahmini hakkındaki bölümlerimizde gösterildiği gibi, daha uygun bir yaklaşım, istatistiksel bir testin önem seviyelerinin hesaplanması için formüllerin alınması ve n için çözmek için cebir kullanılması, bunları örnek büyüklüğü hesaplama formüllerine dönüştürmektir. Bu formüller daha sonra, gerekli numune boyutunu tahmin etmek için belirli bir durum için bilmeniz veya tahmin etmeniz gerekenler hakkında özel rehberlik sağlar.
T-dağılımıyla (z-dağılımının aksine) bile, en az 30'luk bir örneklem büyüklüğüne sahip olmanız gerektiği fikri, dağıtımın gelişim tarihi ile tutarsızdır. 1899'da Oxford'da New College'da kimya ve matematik dereceleriyle mezun olan William S. Gossett, Guinness bira fabrikasına katılan ilk bilim insanlarından biri oldu. “Gününün devleriyle karşılaştırıldığında, çok az yayın yaptı, ancak katkısı kritik öneme sahip. … Demleme işleminin niteliği, sıcaklık ve içerikteki değişkenliği ile uzun süre boyunca büyük numunelerin alınmasının mümkün olmadığı anlamına gelir ”(Cowles, 1989, s. 108–109).
Bu, Gossett'in eserinde z-puanlarını kullanamayacağı anlamına geliyordu; sadece küçük örneklerle iyi çalışmadılar. Küçük örneklerle yapılan istatistiksel testler için z dağılımının eksikliklerini analiz ettikten sonra, yayınlamayı yasaklayan Guinness politikaları nedeniyle “Öğrenci” takma adı altında yayınlanan tablolarını oluşturmak için serbestlik derecelerinin bir fonksiyonu olarak gerekli ayarlamaları yaptı. çalışanlar tarafından (Salsburg, 2001). Tabloların yayınlanmasına yol açan çalışmada, Gossett, Monte Carlo simülasyonlarının erken bir versiyonunu gerçekleştirmiştir (Stigler, 1999). Suçlulara yapılan fiziksel ölçümlerle etiketlenmiş 3000 kartı hazırladı, karıştırdı, sonra onları 4'ten 750'ye kadar olan, yani 30'dan daha küçük bir örneklem grubuyla dağıttı.
BİZİM ÖNERİMİZ
Bu tartışma “Beşinci Yeterince” ile aynıdır, ancak 6. Bölümde yer alan “Sekiz Yeterli Değil” argümanına benzer, ancak biçimlendirici araştırmalardan ziyade özetleyici olarak uygulanır. Herhangi bir araştırma için, test edilecek kullanıcı sayısı testin amacına ve toplamayı planladığınız veri türüne bağlıdır. “Sihirli sayı” 30 bazı deneysel gerekçelere sahiptir, ancak bizce çok zayıf. Bu kitapta, 30'a eşit olmayan (bazen daha az, bazen daha fazla) örneklem büyüklüğüne sahip sayısız örnekten görebileceğiniz gibi, bu genel kuralları çok fazla dikkate almıyoruz. Özet araştırma için örneklem büyüklüğü bölümünde açıklandığı gibi, bir çalışma için uygun örneklem büyüklüğü dağılımın türüne, verilerin beklenen değişkenliğine, istenen güven ve güç seviyelerine,
Şekil 9.2'de gösterildiği gibi, t-dağılımını çok küçük numunelerle kullanırken (örneğin, 5'den düşük serbestlik derecelerinde), t'nin çok büyük değerleri Tip I hatalarının kontrolü bakımından küçük numune boyutlarını telafi eder ( bir fark iddia etmek, gerçekten olmadığı zaman anlamlıdır). Bu küçük örneklem büyüklükleriyle, güven aralıklarınız daha büyük örneklerle elde edeceğinizden çok daha geniş olacaktır. Ancak, 5 dereceden fazla serbestlik derecesine sahip olduğunuzda, z'nin değeri ile t'nin değeri arasında çok az kesin bir fark vardır. T'den z'ye yaklaşım açısından 10 serbestlik derecesinden çok az kazanç var.
T-dağılımını kullanmak z-dağılımından ziyade daha karmaşık değildir (yalnızca serbestlik dereceleri için doğru değeri kullandığınızdan emin olmanız gerekir) ve t-dağılımının gelişmesinin nedeni Küçük örneklerin analizini mümkün kılar. Bu, kullanılabilirlik uygulayıcılarının bira ve bira bira pratiğinden yararlanmalarının daha az açık yollarından sadece bir tanesidir. İstatistik tarihçileri, Gossett'in Öğrenci t-testi yayınını bir dönüm noktası olayı olarak görmektedir (Box, 1984; Cowles, 1989; Stigler, 1999). Gossett, “A., modern istatistiklerin babalarından biri” olan t. Gossett bir çok şeyi doğru yaptı, ama kesinlikle bunu yanlış anladı.
REFERANSLAR
Box, GEP (1984). İstatistiğin gelişiminde uygulamanın önemi. Technometrics, 26 (1), 1-8.
Box, JF (1978). Fisher, bir bilim insanının hayatı. New York, NY: John Wiley.
Bradley, JV (1978). Bozulmazlık? İngiliz Matematiksel ve İstatistik Psikoloji Dergisi, 31, 144-152.
Cohen, J. (1990). Öğrendiğim şeyler (şimdiye kadar). Amerikan Psikoloğu, 45 (12), 1304-1312.
Cowles, M. (1989). Psikolojide İstatistik: Tarihsel bir bakış açısı. Hillsdale, NJ: Lawrence Erlbaum.
Salsburg, D. (2001). Çay tadımı yapan bayan: İstatistikler yirminci yüzyılda bilimde nasıl bir devrim yarattı. New York, NY: WH Freeman.
Stigler, SM (1999). Tablodaki İstatistikler: İstatistiksel kavram ve yöntemlerin tarihi. Cambridge, MA: Harvard Üniversitesi Yayınları.