Her iki test de yaş-yanıt ilişkisini dolaylı olarak modelleyebilir, ancak bunu farklı şekillerde yaparlar. Hangisini seçeceğiniz, bu ilişkiyi nasıl modellemeyi seçtiğinize bağlıdır. Seçiminiz, varsa, altta yatan bir teoriye bağlı olmalıdır; sonuçlardan ne tür bilgiler elde etmek istediğinize; ve numunenin nasıl seçildiği. Bu cevap bu üç yönü sırasıyla tartışmaktadır.
T-testi ve lojistik regresyonu, iyi tanımlanmış bir insan popülasyonu üzerinde çalıştığınızı ve örneklemden bu popülasyona çıkarımlar yapmak istediğinizi varsayan dili kullanarak anlatacağım.
Her türlü istatistiksel çıkarımı desteklemek için numunenin rastgele olduğunu varsaymalıyız.
Bir t-testi , "hayır" yanıtını veren örneklemdeki kişilerin, popülasyondaki tüm yanıt vermeyenlerin basit rastgele bir örneği olduğunu ve "evet" yanıtını veren örneklemdeki kişilerin, nüfus.
Bir t testi, yaşların popülasyondaki iki grubun her birine dağılımı hakkında ek teknik varsayımlar yapar. Muhtemel olasılıkları ele almak için t-testinin çeşitli versiyonları mevcuttur.
Lojistik regresyon , belirli bir yaştaki tüm insanların, nüfus içinde o yaştaki insanların basit bir rastgele örneği olduğunu varsayar. Ayrı yaş grupları farklı oranlarda "evet" yanıtı gösterebilir. Bu oranlar, log olasılıkları olarak ifade edildiğinde (düz oranlar yerine), yaşla (veya yaşın belirli bazı işlevleriyle) doğrusal olarak ilişkili olduğu varsayılır.
Lojistik regresyon, yaş ve yanıt arasındaki doğrusal olmayan ilişkilere uyum sağlamak için kolayca genişletilebilir. Böyle bir uzatma, başlangıçtaki doğrusal varsayımın makul olup olmadığını değerlendirmek için kullanılabilir. Doğrusal olmayanları görüntülemek için yeterli ayrıntı veren büyük veri kümeleriyle uygulanabilir, ancak küçük veri kümeleriyle çok fazla kullanılması muhtemel değildir. Genel bir kural - regresyon modellerinin parametrelerden on kat daha fazla gözlemi olması gerektiğidir - doğrusal olmayanlığı (doğrusal bir fonksiyonun kesişmesine ve eğimine ek olarak üçüncü bir parametreye ihtiyaç duyan) tespit etmek için 20'den fazla gözlemin gerekli olduğunu gösterir. ).
Bir t testi, ortalama yaşların popülasyondaki hayır ve evet yanıtlayanlar arasında farklılık gösterip göstermediğini tespit eder. Lojistik bir regresyon, yanıt oranının yaşa göre nasıl değiştiğini tahmin eder. Bu nedenle, t-testinden daha esnek ve daha ayrıntılı bilgi sağlayabilmektedir. Öte yandan, grupların ortalama yaşları arasındaki farkı saptamak amacıyla t-testinden daha az güçlü olma eğilimindedir.
Test çiftinin, dört anlamlılık ve önemsizliğin dört kombinasyonunu da sergilemesi mümkündür. Bunlardan ikisi sorunlu:
T testi anlamlı değildir, ancak lojistik regresyon önemlidir. Her iki testin varsayımları mantıklı olduğunda, böyle bir sonuç pratik olarak imkansızdır, çünkü t-testi, lojistik regresyonun ortaya koyduğu gibi belirli bir ilişkiyi tespit etmeye çalışmamaktadır. Bununla birlikte, bu ilişki en yaşlı ve en genç öznelerin bir görüşü ve orta yaşlı özneleri başka bir şekilde paylaşmasına neden olacak kadar doğrusal olmadığında, lojistik regresyonun doğrusal olmayan ilişkilere genişletilmesi, hiçbir t-testinin tespit edemediği durumu tespit edebilir ve ölçebilir. .
T testi önemlidir ancak lojistik regresyon, sorudaki gibi değildir. Bu, özellikle bir grup genç katılımcı, bir grup yaşlı katılımcı ve aralarında çok az kişi olduğunda olur. Bu, hayır ve evet yanıtlayanların yanıt oranları arasında büyük bir ayrım yaratabilir. T-testi ile kolayca tespit edilir. Bununla birlikte, lojistik regresyon ya yanıt oranının gerçekte yaşla nasıl değiştiği hakkında nispeten az ayrıntılı bilgiye sahip olur ya da sonuçsuz bilgiye sahip olur: tüm yaşlı insanların bir yöne ve tüm gençlere başka bir şekilde yanıt verdiği "tam ayrılma" durumu - ancak bu durumda her iki test de genellikle çok düşük p değerlerine sahip olacaktır.
Deney tasarımının bazı test varsayımlarını geçersiz kılabileceğini unutmayın. Örneğin, tabakalı bir tasarımda insanları yaşlarına göre seçtiyseniz, t-testinin (her grubun yaşların basit rastgele örneklerini yansıttığı) varsayımı sorgulanabilir hale gelir. Bu tasarım lojistik regresyona dayanmayı önerecektir. Bunun yerine, yanıt vermeyenlerden biri ve evet yanıtlayanlardan biri olmak üzere iki havuzunuz varsa ve yaşlarını belirlemek için rastgele seçtiyseniz, t-testindekiler geçerli olacak şekilde lojistik regresyonun örnekleme varsayımları şüphelidir. Bu tasarım bir çeşit t-testi kullanılmasını önerecektir.
(İkinci tasarım burada aptalca görünebilir, ancak "yaş" ın yerini zor, maliyetli veya zaman alıcı olan bazı özelliklerle değiştirildiği durumlarda çekici olabilir.)