Excel'deki çeyrekler


10

Ben genellikle temel istatistiklerde kullanılırken kullanılan çeyreklik tanımı ile ilgileniyorum. Bir Stat 101 tipi kitabım var ve sadece sezgisel bir tanım veriyor. "Verilerin yaklaşık dörtte biri ilk çeyrekte veya altına düşüyor ..." Ancak, veri kümesi için Q1, Q2 ve Q3 değerlerini hesapladığı bir örnek veriyor

5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37

15 veri parçası bulunduğundan, medyan Q2 olarak 15'i seçer. Daha sonra, kalan verileri 5 ila 14 ve 16 ila 37 olmak üzere iki yarıya ayırır. Bunların her biri 7 veri içerir ve sırasıyla bu grupların her birinin medyanını sırasıyla Q1 ve Q3 olarak bulurlar. Bunu kendim böyle hesaplardım.

Wikipedia'nın makalesine baktım ve 2 yöntem veriyor. Biri yukarıdakileri kabul eder ve biri medyan 15'i her iki sete de dahil edebileceğinizi söyler (ancak çift sayıda veri noktası durumunda iki orta sayının ortalaması olsaydı medyanı eklemezsiniz). Bu benim için anlamlı.

Ama sonra Excel'i nasıl hesapladığını görmek için Excel'i kontrol ettim. 3 farklı işlevi olan Excel 2010 kullanıyorum. Quartile, 2007 ve önceki sürümlerinde mevcuttu. 2010 yılında bunu kullanmayı bırakmanızı istiyorlar ama hala mevcut. Quartile.Inc yeni ama söyleyebildiğim kadarıyla Quartile ile aynı fikirde. Ve Quartile.Exc de var. Her ikisi de 2010 yılında yeni inanıyorum. Bu sefer, sadece 1, 2, 3, ..., 10 tam sayılarını kullanmayı denedim. Excel'in 5.5, Q1 / 3 ve Q3'ün medyanını vermesini bekliyorum. İstatistik kitabından da yöntem Wikipedia'da her iki yöntem de bu cevapları verir, çünkü medyan orta iki sayının ortalamasıdır. Excel verir

quartile number, Quartile.Inc, Quartile.Exc
1,               3.25,         2.75 
2,               5.5,          5.5
3,               7.75,         8.25

Bunların hiçbiri daha önce bahsettiğim şeyle aynı fikirde değil.

Excel için yardım dosyasındaki açıklamalar şunlardır:

Quartile.Inc - Bir veri kümesinin 0..1 dahil yüzdelik değerlerine dayanarak dörtte birlik bölümünü döndürür.

Quartile.Exc - Veri kümesinin çeyrek değerini, 0..1'deki yüzdelik değerlere dayalı olarak döndürür.

Herhangi biri Excel'in kullandığı bu tanımı anlamama yardımcı olabilir mi?


5
Excel'i neden istatistiksel bir şey için kullanmamanın bir başka harika örneği. :-)
Wayne

1
Arkadaşlar, istatistik için arkadaşlarının Excel kullanmalarına izin vermez. Üzgün ​​ama gerçek
Chris Beeley

Yanıtlar:


11

Tipik olarak, bir sırası ( n verisi için 1 ile n arasında ) formül aracılığıyla yüzde p'ye dönüştürülürr1nnp

p=100rαn+12α

α01rp

r=(n+12α)(p/100)+α.

α=1PERCENTILEQUARTILEQUARTILE.INCQUARTILE.EXC

(1,2,3,4,5,6,7,8,9,10)n=10p{25,50,75}α=19(0.25)+1=3.259(0.50)+1=5.59(0.75)+1=7.75QUARTILE.INC

α=011(0.25)=2.7511(0.50)=5.511(0.75)=8.25QUARTILE.EXC

α

Bu arada, kesirli dereceler doğrusal enterpolasyon yoluyla veri değerlerine dönüştürülür. Süreç, Yüzdelikler ve EDF Grafiklerindeki ders notlarımda açıklanır ve gösterilir - bu sayfanın alt kısmına bakın. Hesaplamaları gösteren bir Excel elektronik tablosuna da bağlantı vardır.

Excel'de genel bir yüzdelik işlev uygulamak istiyorsanız , işte bunu yapmak için bir VBA makrosu:

'
' Converts a percent, computed using plotting position constant A,
' into a percent appropriate for the Excel Percentile() and
' Quartile() functions.  (The default value of A for Excel is 1;
' most values in use are between 0 and 0.5.)
'
Public Function PercentileA(P As Double, N As Integer, A As Double) As Double
    If N < 1 Or A < 0# Or A > 1# Or P < 0# Or P > 1# Then
        Exit Function
    End If
    If N < 2 Then
        PercentileA = 0.5
    Else
        PercentileA = ((N - 2 * A + 1) * P + A - 1) / (N - 1)
    End If
End Function

Nominal bir yüzdeyi (25/100 gibi) Excel'in PERCENTILEişlevinin istenen değeri döndürmesine neden olacak yüzdeye dönüştürür . Hücre formüllerinde olduğu gibi kullanılması amaçlanmıştır =PERCENTILE(Data, PercentileA(0.25, Count(Data), 0.5)).


Excel'in tam olarak ne yaptığını anladıktan sonra, istatistiksel çalışma için etkili bir şekilde kullanabileceğinizi unutmayın.
whuber

5
Yorumunuza mizahi bir şekilde katılmıyorsam: Excel istatistiksel çalışma için etkili bir şekilde kullanılabilir, eğer ilk prensiplerden ne yapılması gerektiğini kanıtlayabilen bir istatistiksel sihirbazsanız, aslında ne yaptığını belirlemek için Excel'in yöntemlerini tersine mühendislik yapın. Bu kadar iyi olduğunuzda, çoğu araç bunu yapar. Ben de bu iş parçacığında, bu tartışmaya dahil olan sihirbazların% 100'ünün Excel'in en son sürümüne erişimi olmadığını, bu yüzden bunu kullanmanın olası olmadığını da belirtmek isterim.
Wayne

Touche ', @Wayne. (Ama bazılarımız hala eski Excel sürümlerini kullanıyor :-).)
Whuber

1
Whuber, VBA çözümünü paylaştığınız için teşekkürler. Bu son derece yardımcı olacaktır. İstatistikler yapması gereken ancak kolayca kullanılabilen tek araç olarak Excel ile sıkışmış biri olarak (evet, R'yi denedim, ancak kafamı tam olarak alamıyorum), Excel'i ihtiyaçlarıma bükmeye yardımcı olacak araçları takdir ediyorum.
dav

4

Bana öyle geliyor ki, Excel'in R'nin varsayılanı ve diğer tanımlarıyla aynı olan quartile.incorijinali kabul ettiği anlaşılıyor quartile.

Whuber'dan yararlı bir ipucu ile, Excel'in quartile.exc(1..10 davasında) R'nin type=6kantil tanımı ile aynı fikirde olduğunu gördüm :

   > For types 4 through 9, Q[i](p) is a continuous function of p, with
    > gamma = g and m given below. The sample quantiles can be obtained
    > equivalently by linear interpolation between the points (p[k],x[k])
    > where x[k] is the kth order statistic. Specific expressions for p[k]
    > are given below.
    > 
    > ...
    > 
    > 
    > Type 6 m = p
    >       .p[k] = k / (n + 1). Thus p[k] = E[F(x[k])].
    >       This is used by Minitab and by SPSS.

Görünüşe göre sorunuzun cevabı şu: "Evet, Minitab ve SPSS yapar."


R'nin dokuz adet kantil tanımı yok mu? (Düzenleme için +1, btw)
whuber

@whuber: Perdenin arkasındaki adama dikkat etmeyin! (Yanıtımı düzenleyeceğim. Daha fazla incelemede, R'nin Minitab ve SPSS'nin kullandığı açık olan diğer tanımlarından biriyle eşleşiyor. Teşekkürler!)
Wayne

2

Çeyreğin dış aromasının sadece 5 ve 37'yi (orijinal verilerinizdeki min ve maks) görmezden geldiğini düşünüyorum.

Stata'da, hem varsayılan hem de alternatif sürümler, bu verilerle size quartile.exc değerleri verir.


Bu tahmin , max ve min'in gerçekten geri döndürülebileceğini iddia eden belgelerle tutarsız görünüyor QUARTILE.EXC.
whuber

Excel 2010 sürümümde, QUARTILE.EXC (hücre aralığı, k) #SAYI! k = {1,2,3} değilse, görüntülenen açılır menüye göre 25, 50 ve 75. yüzdelik dilimlere karşılık gelir. Orijinal QUARTILE, minimum ve maks. Değerlere karşılık gelen ikinci argüman olarak 0 ve 4'ü kabul eder.
Dimitriy V. Masterov

1
Belgelerde "Quart ≤ 0 ise veya quart ≥ 4 ise, QUARTILE.EXC işlevi #SAYI! Hata değerini döndürür." Bu doğru görünüyor. İkinci deyim "MIN, MEDIAN ve MAX, quart 0 (sıfır), 2 ve 4'e eşit olduğunda sırasıyla QUARTILE.EXC ile aynı değeri döndürür." Ne dağınıklık!
Dimitriy V. Masterov

nn11#NUM!PERCENTILE

1
Yüzdelik dilimin 3 çeşidi benim için çeyrek gibi davranır. 5-37 veri için PERCENTILE.EXC (aralık, k) #SAYI! k = {0,1} için. K = 0.25 için, YÜZDEBİRLİK 10 verir. 5 ve 37'yi atarsam, diğer 2 yolla aynı olan 10.5 verir.
Dimitriy V. Masterov

2

Bir sürü ilginç ayrıntılı şey ama orijinal soruya geri dönmek için, aynı cevabı vermeyebilecek iki farklı yolun gerçekten önemli olduğunu görmüyorum. İlk dörtlü, gözlemlerin% 25'inin ona düştüğü veya altına düştüğü noktadır. Örnek boyutunuza bağlı olarak, verilerde kesin bir nokta olabilir veya olmayabilir. Dolayısıyla, bir nokta aşağıda ve diğeri yukarıda ise, bu ilk çeyrek gerçekten iyi tanımlanmamıştır ve bu ikisi arasındaki herhangi bir nokta eşit derecede iyi hizmet edebilir. Aynısı, numune boyutu eşit olduğunda medyan için de geçerlidir. Kural, aşağıdaki ve yukarıdaki veri noktaları arasındaki orta noktayı seçer. Ancak hiçbir şey, kural tarafından verilen seçimin gerçekten diğer noktalardan daha iyi olduğunu söylemez.


α1/31/2

0

Excel'i kullananlar için burada farklı sürüm yöntemlerinin oldukça iyi bir dökümü var http://peltiertech.com/WordPress/comparison/


2
Cevabınızla özetleyebilmeniz daha iyi olur. Bağlantı soruyu cevaplayabilirken, bazen güncelliğini yitirir, bu durumda cevabınız gelecekteki okuyucular için yararlı olmaz.
Andy

0

excel 2016 yılında fark ettim, eğer bir doğru çeyrek değerleri elde edebilirsiniz:

  • veri kümesinde tek sayıda giriş var: QUARTILE.EXC kullanın
  • veri kümesinde çift giriş vardır: QUARTILE.EXC ve QUARTILE.INC ortalamasını kullanın

1
Diğer cevapların bazılarında kanıtlandığı gibi kaç tane kantil tanımı varsa, doğru değerlerle ne demek istediğinizi açıklayabilir misiniz?
mdewey
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.