İçinde önemi test değersizlik , (1999) Johnson, yeterli veri toplama sıfır hipotezini varsayarak istediğiniz gibi neredeyse her zaman olduğu yanlıştır küçük olarak yapabileceği o p-değerleri, keyfi vardır kaydetti. Gerçek dünyada, tam olarak sıfır olan yarı-kısmi korelasyonlar olma olasılığı düşüktür, bu da bir regresyon katsayısının önemini test etmede sıfır hipotezidir. P-değeri önem kesintileri daha da keyfidir. Anlamlılık ve önemsizlik arasındaki boşluk olarak .05 değeri prensip olarak değil, konvansiyon tarafından kullanılır. Dolayısıyla, ilk sorunuzun cevabı hayırdır, uygun bir anlamlılık eşiğine karar vermenin ilkeli bir yolu yoktur.
Peki, büyük veri kümeniz göz önüne alındığında ne yapabilirsiniz? Bu, regresyon katsayılarınızın istatistiksel önemini araştırmak için nedenlerinize bağlıdır. Karmaşık çok faktörlü bir sistemi modellemeye ve gerçekliğe makul bir şekilde uyan veya öngörmeyi sağlayan kullanışlı bir teori mi geliştirmeye çalışıyorsunuz? O zaman belki daha ayrıntılı bir model geliştirme ve bunun üzerine modelleme perspektifi almayı düşünebilirsiniz, Rodgers (2010), Matematiksel ve İstatistiksel Modelleme Epistemolojisi . Çok fazla veriye sahip olmanın bir avantajı, çok zengin modelleri, çoklu düzeylere ve ilginç etkileşimlere sahip olanları keşfedebilmektir (bunu yapmak için değişkenlere sahip olduğunuzu varsayarak).
Öte yandan, belirli bir katsayıyı istatistiksel olarak anlamlı olarak ele alıp almayacağınıza karar vermek istiyorsanız, Good'in (1982) önerisini Woolley'de (2003) özetlenen olarak almak isteyebilirsiniz : q değerini hesaplama olarak , p değerlerini 100 örnek boyutuna standardize eder. Tam olarak .001'lik bir p değeri, 0,045 olan bir p değerine dönüştürülür - yine de istatistiksel olarak anlamlı.p⋅(n/100)−−−−−−√
Öyleyse, keyfi bir eşik ya da başka bir eşik kullanmak önemliyse, ne olacak? Bu gözlemsel bir çalışma ise, sadece modelinizi yanlış tanımladığınız için ortaya çıkan sahte bir ilişki değil, aslında düşündüğünüz gibi anlamlı olduğunu kanıtlamak için çok daha fazla çalışmanız var. Küçük bir etkinin, bir tedavi etkisinden ziyade farklı tedavi düzeylerine giren insanlar arasında önceden var olan farklılıkları temsil etmesi durumunda klinik olarak ilginç olmadığını unutmayın.
Yorumcuların belirttiği gibi, gördüğünüz ilişkinin pratikte önemli olup olmadığını düşünmeniz gerekir. Dan sen alıntı rakamları dönüştürme için r 2 (varyans için açıkladırr2 kare o varyans açıkladı olsun, korelasyon olduğu) sadece 3 ve% 6 varyans çok gibi görünmüyor hangi sırasıyla izah verir.r