Diğer cevapların aksine, mevcut veriler verildiğinde Cıvata yetenekleri hakkında bir şeyler söyleyebileceğinizi iddia ediyorum. Her şeyden önce, sorunuzu daraltalım. En hızlı insanı soruyorsunuz, ancak en iyi kadın koşucu kadının en iyi erkek koşuculardan biraz daha yavaş olduğu erkek ve kadın için koşu hızlarının dağılımında bir fark olduğu için, erkek koşuculara odaklanmalıyız. Bazı veriler elde etmek için , son 45 yıldan 100'lü yılların en iyi yıl performanslarına bakabiliriz . Bu veriler hakkında dikkat edilmesi gereken birkaç nokta vardır:
- Bunlar en iyi çalışma süreleridir, bu yüzden bize tüm insanların yeteneklerini değil, elde edilen minimum hızları anlatmazlar.
- Bu verilerin dünyadaki en iyi koşucu örneklerini yansıttığını varsayıyoruz. Şampiyonalara katılmayan daha iyi koşucular olsa da, bu varsayım oldukça makul görünmektedir.
İlk olarak, bu verilerin nasıl analiz edilmeyeceğini tartışalım . Çalışma zamanlarını zamana karşı çizersek, güçlü bir doğrusal ilişki gözlemleyeceğimizi fark edebilirsiniz.
Bu, sonraki yıllarda ne kadar iyi koşucu gözlemleyebileceğimizi tahmin etmek için doğrusal regresyon kullanmaya yönlendirebilir. Ancak bu çok kötü bir fikir olacaktır, bu kaçınılmaz olarak yaklaşık iki bin yıl içinde insanların sıfır saniyede 100 metre koşabilecekleri ve bundan sonra negatif çalışma sürelerine ulaşacakları sonucuna götürecektir! Bu açıkçası saçmadır, çünkü kapasitelerimizin bir çeşit biyolojik ve fiziksel sınırı olduğunu hayal edebiliyoruz, bu bizim için bilinmiyor.
Bu verileri nasıl analiz edebilirsiniz? İlk olarak, minimum değerlerle ilgili verilerle uğraştığımıza dikkat edin, bu nedenle bu veriler için uygun modeli kullanmalıyız. Bu bizi aşırı değer teorisi modellerini göz önünde bulundurmaya yönlendirir (bkz. Örneğin Stuart Coles'in Aşırı Değerlerin İstatistiksel Modellenmesine Giriş kitabı). Bu veriler için genelleştirilmiş aşırı değer dağılımı (GEV) olduğunu varsayabilirsiniz . Eğer burada bağımsız ve aynı rastgele değişkenler dağıtılır, daha sonra 'in bir GEV'in dağılım göstermektedir. Minimayı modellemekle ilgileniyorsanız, örnekleriyse,Y= maks. ( X1, X2, … , Xn)X1, X2, … , XnYbenZ1, Z2, … , Zk- ZbenMinimas için bir GEV dağılımını takip eder. Böylece GEV dağıtımını çalışma hızı verilerine sığdırabiliriz, bu da oldukça iyi uyum sağlar (aşağıya bakın).
Modelin önerdiği kümülatif dağılıma bakarsanız, Usain Bolt'un en iyi çalışma süresinin en düşük olduğunu göreceksiniz.% 1dağıtım kuyruğu. Dolayısıyla, bu verilere ve bu oyuncak örneği analizine bağlı kalırsak, çok daha küçük çalışma sürelerinin olası olmadığı (ancak açıkçası, mümkün olduğu) sonucuna varacağız. Bu analizdeki bariz sorun, en iyi çalışma sürelerinde yıldan yıla iyileştirmeler gördüğümüzü göz ardı etmektir. Bu bizi cevabın ilk bölümünde açıklanan soruna geri götürür, yani burada bir regresyon modelinin riskli olduğu varsayılır. Geliştirilebilecek başka bir şey, Bayesian yaklaşımını kullanabilmemiz ve fizyolojik olarak mümkün olan çalışma süreleri hakkında henüz gözlemlenmemiş olabilecek bazı veri dışı bilgileri açıklayabilecek şekilde bilgilendirici olabileceğimizdir (ancak bildiğim kadarıyla, şu anda bilinmemektedir). Son olarak, benzer aşırı değer teorisi spor araştırmalarında zaten kullanıldı, örneğin Einmahl ve Magnus (2008) tarafındanAşırı Değer Teorisi ile Atletizm Kayıtları .
Daha hızlı çalışma süresinin olasılığı hakkında değil, daha hızlı koşucu gözlemleme olasılığı hakkında soru soracağınızı protesto edebilirsiniz. Ne yazık ki, burada çok fazla bir şey yapamayız, çünkü bir koşucunun profesyonel bir atlet olma olasılığının ne olduğunu bilmiyoruz ve kaydedilen çalışma süreleri onun için mevcut olacak. Bu rastgele gerçekleşmez ve bazı koşucuların profesyonel sporcu olmasına ve bazılarının sevmemesine (veya birisinin koşmayı ve koşmayı sevmesine) katkıda bulunan birçok faktör vardır. Bunun için, koşucular hakkında ayrıntılı bir nüfus geneli verisine sahip olmalıyız, dahası, dağıtımın aşırı uçlarını sorduğunuzdan, verilerin çok büyük olması gerekir. Bu yüzden, diğer cevaplara katılıyorum.