İstatistik tablolarında (enterpolasyonda) verilmeyen değerleri nasıl bulurum?


19

Çoğu zaman insanlar p değerlerini elde etmek için programları kullanırlar, ancak bazen - her ne nedenle olursa olsun - bir dizi tablodan kritik bir değer elde etmek gerekebilir.

Sınırlı sayıda anlamlılık seviyesi ve sınırlı sayıda serbestlik derecesine sahip bir istatistiksel tablo göz önüne alındığında, diğer anlamlılık düzeylerinde veya serbestlik derecelerinde ( , ki-kare veya tablolarında olduğu gibi) yaklaşık kritik değerleri nasıl elde edebilirim? ?tF

Yani, değerleri bir tablodaki değerler arasında nasıl bulabilirim?

Yanıtlar:


26

Bu cevap iki ana kısımdadır: birincisi, doğrusal enterpolasyon kullanarak , ikincisi daha doğru enterpolasyon için dönüşümleri kullanarak. Burada tartışılan yaklaşımlar, sınırlı tablolarınız olduğunda el hesaplaması için uygundur, ancak p-değerleri üretmek için bir bilgisayar rutini uyguluyorsanız, bunun yerine kullanılması gereken daha iyi yaklaşımlar (elle yapılırsa sıkıcı) vardır.

Bir z testi için% 10'luk (bir kuyruklu) kritik değerin 1,28 ve% 20'lik kritik değerin 0,84 olduğunu biliyorsanız,% 15'lik kritik değerde kabaca bir tahmin - (1,28 + 0,84) / 2 = 1.06 (gerçek değer 1.0364'tür) ve% 12.5 değeri bununla% 10 değerinin (1.28 + 1.06) / 2 = 1.17 (gerçek değer 1.15+) arasında tahmin edilebilir. Doğrusal enterpolasyon tam olarak bunu yapar - ancak 'aradaki yol' yerine, iki değer arasındaki yolun herhangi bir bölümüne bakar.

Tek değişkenli doğrusal enterpolasyon

Basit doğrusal enterpolasyon örneğine bakalım.

Bu nedenle , yaklaşık olarak tahmin etmeye çalıştığımız değerin yakınında yaklaşık olarak doğrusal olduğunu düşündüğümüz bazı fonksiyonlarımız var ( diyelim ) ve örneğin istediğimiz değerin her iki tarafındaki fonksiyonun bir değerine sahibiz, örneğin:x

xy89.316y162015.6

İki , değerleri 's bildiğimiz ayrı 12 (20-8) bulunmaktadır. Bkz ne -değeri (biz yaklaşık istediğiniz bir için-değeri) böler bu oran 8 12 kadar farkı: 4 (16-8 ve 20-16)? Yani, ilk değerinden sonuncuya olan mesafenin 2 / 3'ü . İlişki doğrusal olsaydı, karşılık gelen y-değerleri aralığı aynı oranda olurdu.y x y xxyxyx

doğrusal enterpolasyon

Bu yüzden , ile hemen hemen aynı olmalıdır . 16-8y169.315.69.3168208

Buy169.315.69.3168208

yeniden düzenleme:

y169.3+(15.69.3)168208=13.5

İstatistiksel tablolara örnek: 12 df için aşağıdaki kritik değerlere sahip bir t-tablonuz varsa:

(2-tail)αt0.013.050.022.680.052.180.101.78

T'nin kritik değerini 12 df ve iki kuyruklu alfa 0.025 ile istiyoruz. Yani, bu tablonun 0.02 ve 0.05 satırı arasında enterpolasyon yapıyoruz:

αt0.022.680.025?0.052.18

" " değer, yaklaşık olarak doğrusal enterpolasyon kullanmak istediğimiz değeridir. ( Aslında dağılımının ters noktasını .)?t0.025t0.02510.025/2t12

Daha önce olduğu gibi, aralığı ila (yani ) oranında ila böler ve bilinmeyen değeri, aralığı ila aynı oranda bölmelidir ; eşdeğer olarak, oluşur aralığı boyunca yolun , bu nedenle bilinmeyen değeri aralığı boyunca yolun olmalıdır .0.0250.020.05(0.0250.02)(0.050.025)1:5tt2.682.180.025(0.0250.02)/(0.050.02)=1/6xt1/6t

Bu veya eşdeğerit0.0252.682.182.680.0250.020.050.02

t0.0252.68+(2.182.68)0.0250.020.050.02=2.680.5162.60

Asıl cevap ... ki bu yakın değildir çünkü yaklaştığımız fonksiyon o aralıktaki çizgiye çok yakın değildir (daha yakın ).2.56α=0.5

t-tablolarında kritik değerin doğrusal enterpolasyonu

Dönüşüm ile daha iyi yaklaşımlar

Doğrusal enterpolasyonu diğer fonksiyonel formlarla değiştirebiliriz; aslında doğrusal enterpolasyonun daha iyi çalıştığı bir ölçeğe dönüşüyoruz. Bu durumda, kuyrukta, tablo haline getirilmiş birçok kritik değer , önem seviyesinin log'una daha yakındır . s aldıktan sonra , daha önce olduğu gibi doğrusal enterpolasyon uygularız. Yukarıdaki örnekte deneyelim:loglog

αlog(α)t0.023.9122.680.0253.689t0.0250.052.9962.18

şimdi

t0.0252.682.182.68log(0.025)log(0.02)log(0.05)log(0.02)=3.6893.9122.9963.912

Veya eşdeğer olarak

t0.0252.68+(2.182.68)3.6893.9122.9963.912=2.680.50.2432.56

Belirtilen rakam sayısı için doğrudur. Çünkü - x ölçeğini logaritmik olarak dönüştürdüğümüzde - ilişki neredeyse doğrusaldır:

log alfada doğrusal enterpolasyon
Gerçekten de, görsel olarak eğri (gri) düz çizginin (mavi) üstünde düzgün bir şekilde uzanır.

Bazı durumlarda, logit anlamlılık düzeyi (ve ) daha geniş bir aralıkta iyi çalışabilir, ancak genellikle gerekli değildir (genellikle oldukça iyi çalıştığında yeterince küçük olduğunda doğru kritik değerleri önemsiyoruz ).logit(α)=log(α1α)=log(11α1)αlog

Farklı serbestlik derecelerinde enterpolasyon

t , ki-kare ve tablolarında da serbestlik dereceleri vardır; burada her df ( -) değerinin tablolaştırılmadığı yerler. Kritik değerler çoğunlukla , doğrusal enterpolasyon ile doğru şekilde temsil edilmez. Gerçekten de, genellikle neredeyse tablo haline getirilmiş değerlerin df, karşılıklılığında doğrusal olması söz konusudur .Fν1/ν

(Eski tablolarda genellikle ile çalışmak için bir öneri görürsünüz - paydaki sabit hiçbir fark yaratmaz, ancak ön hesaplayıcı günlerde daha kullanışlıdır, çünkü 120 çok fazla faktöre sahiptir, bu nedenle genellikle bir tamsayıdır ve hesaplamayı biraz daha basit hale getirir.)120/ν120/ν

Ters enterpolasyonun ve arasındaki % 5 kritik değerlerinde nasıl performans gösterdiği aşağıda açıklanmıştır . Yani, enterpolasyona sadece uç noktalar katılır . Örneğin, için kritik değeri hesaplamak için şunu alırız (ve burada cdf'nin tersini temsil ettiğini unutmayın ):F4,νν=601201/νν=80F

F4,80,.95F4,60,.95+1/801/601/1201/60(F4,120,.95F4,60,.95)

df'de ters çeviri

( Burada şema ile karşılaştırın )


Çoğunlukla ama her zaman değil. Burada, df'deki lineer enterpolasyonun daha iyi olduğu bir örnek ve tablodan lineer enterpolasyonun doğru olacağını nasıl anlayacağınıza dair bir açıklama.

İşte ki kare bir masa

            Probability less than the critical value
 df           0.90      0.95     0.975      0.99     0.999
______   __________________________________________________

 40         51.805    55.758    59.342    63.691    73.402
 50         63.167    67.505    71.420    76.154    86.661
 60         74.397    79.082    83.298    88.379    99.607
 70         85.527    90.531    95.023   100.425   112.317

57 serbestlik derecesi için% 5 kritik değeri (95. persentiller) bulmak istediğimizi düşünün.

Yakından baktığımızda, tablodaki% 5 kritik değerlerin neredeyse doğrusal olarak ilerlediğini görüyoruz:

resim açıklamasını buraya girin

(yeşil çizgi 50 ve 60 df için değerleri birleştirir; 40 ve 70 için noktalara dokunduğunu görebilirsiniz)

Dolayısıyla, doğrusal enterpolasyon çok iyi olacaktır. Ama elbette grafiği çizmek için zamanımız yok; doğrusal enterpolasyonun ne zaman kullanılacağına ve ne zaman daha karmaşık bir şeyin deneneceğine nasıl karar verilir?

Aradığımız tarafın her iki tarafındaki değerlerin yanı sıra, bir sonraki en yakın değeri (bu durumda 70) alın. Orta tablo değeri (df = 60 için olan) son değerler (50 ve 70) arasında doğrusalya yakınsa, doğrusal enterpolasyon uygun olacaktır. Bu durumda, değerleri, özellikle kolaydır, böylece eşit aralıklı edilir: bir yakın ?(x50,0.95+x70,0.95)/2x60,0.95

Biz bulmak 2 , 60 df, 79,082 gerçek değere kıyasla, biz görebilirsiniz, bu durumda genellikle enterpolasyon için oldukça iyi neredeyse üç tam rakamlara doğru doğrusal enterpolasyona bağlı kalırsınız; ihtiyaç duyduğumuz değer için daha ince bir adımla, şimdi etkili bir şekilde 3 rakam doğruluğuna sahip olmayı beklerdik.(67.505+90.531)/2=79.018

Bu yüzden şunu elde ederiz: veyax67.50579.08267.50557506050

x67.505+(79.08267.505)5750605075.61 .

Gerçek değer 75.62375'tir, bu yüzden gerçekten 3 doğruluk rakamı aldık ve dördüncü rakamda sadece 1 tane kaldık.

Sonlu farklar (özellikle bölünmüş farklar yoluyla) yöntemleri kullanılarak daha doğru enterpolasyon hala sağlanabilir, ancak bu muhtemelen hipotez test problemlerinin çoğu için aşırı doludur.

Özgürlük dereceleriniz masanızın sonlarını geçerse, bu soru bu sorunu tartışır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.