İstatistiksel geçmişi olmayan insanlara istatistiksel önemi nasıl açıklarsınız?


11

Arka plan:
İstatistikte mutlak bir başlangıç ​​yapan bir müvekkil (bir tür avukat) için veri analizi yapmak zorunda kaldım. Bana "istatistiksel anlamlılık" teriminin ne anlama geldiğini sordum ve gerçekten açıklamaya çalıştım ... ama başarısız olduğum şeyleri açıklamakta iyi olmadığım için;)

Yanıtlar:


15

Farklılıklar şansın bir sonucu olarak ortaya çıkar.

Bir şeyin istatistiksel olarak anlamlı olduğuna inandığımızda, farkın, bir şans oluşumu olarak makul olarak açıklanabilecek kadar büyük olduğuna inanıyoruz.


Şans kullanımını seviyorum, ancak önem testinin yaygın olarak nasıl kullanıldığı konusunda oldukça yanıltıcı olduğunu düşünüyorum. Örneğin, büyük örnek boyutu, "şans" temel farklılıkları nedeniyle neredeyse her zaman önem kazanacağınız anlamına gelir. Bu sonuçların, makul bir şekilde tesadüfen açıklanmasına rağmen "istatistiksel olarak anlamlı" olarak adlandırılabileceği oldukça yaygın bir şekilde kabul edilmektedir.
Flask

@Flask: şans eseri bu temel farklılıklar ne anlamda?
Scortchi - Monica'yı eski durumuna döndürün

@Scortchi Rasgeleleştirme yapılmışsa, farklılıklar şansa bağlı olabilir. Buraya bakın . Gerçekleştirilmiş olsa bile, bir şey daha sonra yanlılığa neden olabilir. Buraya bakın . Rasgeleleştirme yapılmadıysa, bunun nedeni şans veya araştırmacı yanlılığı veya herhangi bir neden olabilir.
Flask

1
Sadece farklılık testlerinde geçerli olması dışında faydalı cevap.
rolando2

2
+1 Bu mükemmel bir cevaptır, çünkü p-değerleri, olasılıklar, dağılımlar, boş hipotezler vb. Kapsamlı olmayabileceği konu yanında: detaylar ve varyasyonlar daha sonra ele alınabilir. Bunu geliştirmek için bastırılırsa, yapacağım temel değişiklik, istatistiksel anlamlılık hakkındaki inançların verilere dayandığını vurgulamak olacaktır: bu tanım, örneğin teolojik inançlardan ayırt edilebilir.
whuber

3

NOT: Bu cevapta vurgulamak istediğim, istatistiksel anlamlılığın yararlı bir araç olduğu, aynı zamanda gerçeklerden farklı olduğudur.

52 kartlık bir paket alın. Müvekkilim masum ise, normal bir kart paketi, 13 kalp. Müvekkilim yalan söylüyorsa sabit bir pakettir ve 52 kartın tamamı kalbidir.

İlk kartı çiziyorum ve bu bir kalp. Aha, suçlu! Açıkça sağduyu bize durumun böyle olmadığını söylüyor: masum olsa bile, bunun dört şanstan biri vardı. Biz yok istatistiksel anlamlılık sadece bir karta bakarak.

İkinci bir kart çekiyoruz. Başka bir kalp. Hhhmmm ... kesinlikle suçlu! Kalan 51 kartta hala 12 kalp vardı, bu yüzden imkansız değil. Matematik (13/52 * 12/51 = 0.0588) bize bunun masum olsa bile zamanın yaklaşık% 6'sında gerçekleştiğini söylüyor. Çoğu bilim adamı için bu hala geçerli olmayacaktır.

Üçüncü bir kart, başka bir kalp çizin! Üç sıra üstüste. Bunun gerçekleşme şansı (13/52 * 12/51 * 11/50 = 0.01294), bu yüzden bu durumun% 1'inden biraz fazlası tesadüfen gerçekleşebilir.

Bilimin çoğunda% 5 kesme noktası olarak kullanılır. Yani bu üç karttan başka bir kanıtınız yoksa, onun suçlu olduğuna dair istatistiksel olarak anlamlı bir sonucunuz var.

Önemli olan şudur: Suçluluğuna olan güveninize daha fazla kart bakmanıza izin verilir, bu da istatistik öneminin ne kadar yüksek olduğunu söylemenin başka bir yoludur.

NOT: 14 karta bakmanıza izin verilmediği sürece asla onun suçluluğuna dair bir kanıtınız yoktur . Normal bir kart paketi ile teorik olarak arka arkaya 13 kalp çizmek mümkündür, ancak 14 imkansızdır. [Şakacıların yanı sıra: kartlardaki sayıların görünür olmadığını varsayalım; tüm kartlar dört olası renkten biridir ve hepsi budur.]

NOT: kalpten başka bir kart çektiğinizde masumiyetinin kanıtı vardır . Bunun nedeni sadece iki olası paketin olmasıdır: normal veya tüm kalpler. Gerçek hayat daha karmaşıktır ve matematik de daha karmaşık hale gelir.

Bu arada, müşteriniz bir kart oyuncusu değilse, Tekel'i deneyin: herkes bir süre altı katına çıkar; ama birileri her şüpheye düştüğünüzde altı buçuk alırsa. İstatistikler, ne kadar şüpheli olmamız gerektiğine dair kesin bir rakam koymamıza izin veriyor.


3

Kendi tavsiyem, aşağıdakiler hakkında konuşmak değil :

  1. p-değerleri,
  2. Test-istatistikleri,
  3. olayların tek başına tesadüfen olma olasılığı.

Avukat konusunda çok zor olma. Bu, bir üniversite İstatistik dersinde en az bir sömestr geçiren eğitimli bir kişidir ve bir kısmı onunla sıkışıp kalmamıştır. Neredeyse birlikte çalıştığım diğer bilim insanı olmayanlar için de aynı hikaye var - istatistiksel olarak anlamlı değil . Bu çok doğal olmayan bir kavram.

İstatistiksel önemi kanıt açısından açıklamanızı öneririm . Klasik istatistikçiler, daha küçük değerlerin daha fazla kanıt oluşturduğu ve 0.05'in çizginin geleneksel olarak çizildiği yerdir.


imo sig fikri. bilim insanı olmayanlarla yapışabilir; genellikle doğal olmayan olarak görülen, teknik tanımdır, eğer insanlar bu kadar ileri giderse. Kanıt olarak, elbette bu kanıtla ilgilidir: soru, sig hakkında bir karara varmak için kişinin kanıtlarla nasıl istatistiksel olarak uğraştığıdır.
rolando2

Iyimserlikten hoşlanıyorum, ancak tipik bir kişi için istatistiksel önemin kanıtla ilgili olduğu açık değil. Veri kümeniz yeterince büyüdüğünde ve hesaplanan tüm sayılar artık bir şekilde "geçerli" olduğunda, bunların bir çeşit anahtar olarak gördüklerini düşünüyorum. Yazarın kanıtların nasıl niceliklendirildiğini bilmesinin önemli olduğunu iddia ediyorsunuz, bu yüzden muhtemelen ilk başta doğru olduğuna inanmadığınız bir hipotez altında hesaplanan olasılıklar hakkında konuşmaya hazır olun.
Ben Ogorek

Ah ama kanıt hakkında konuşursanız, Bayes topraklarına girersiniz.
Arthur B.

1
Bayesyanların kesinlikle “resmileştirdiğini” (kavram) düşünmüyorum, ama kesinlikle resmileştirdiler. Küçük bir p-değerinin bir şeyin kanıtı olduğunu iddia ediyorum.
Ben Ogorek

1

"İstatistiksel olarak anlamlı", bir şeyin rastgele gerçekleşmiş olabileceği anlamına gelir, ancak olası değildir. Bunun yerine, bir tür nedenin olması çok daha muhtemeldir. Müşterinizle ilgili bir örnekle bunu daha somut hale getirmelisiniz, çünkü bu açıklama çok soyut.

Örneğin, avukat Anne ortalama Bill'den çok daha fazla dava kazanırsa, bu sadece rastgele olabilirdi. Bununla birlikte, Anne istatistiksel olarak anlamlı daha fazla dava kazanırsa, Anne'nin neden Bill'den daha fazla dava kazandığını açıklamaya yardımcı olabilecek bir şey olması çok daha olasıdır. Sebebini bilmiyoruz. Belki Anne daha iyi bir avukattır ya da Bill bilerek daha zor olan davaları seçer.


0

Basit ve özlü tutun!

Bir p değeri, null değerinin doğru olduğu varsayılarak gözlemlediğimiz kadar yüksek veya aşırı sonuç alma olasılığı olarak tanımlanır. P değeri yeterince küçükse, null değeri doğru olmayabilir. "Yeterince küçük" (alfa) olduğunu düşündüğümüz şey için keyfi olarak bir kesme seçiyoruz ve alfa altına düşen tüm p değerleri için null değerini reddediyoruz.

Giriş istatistikleri sınıfımı bu şekilde açıklarım.


Peki ya makul bir sıfır hipotezi seçmenin bir yolu yoksa (yani, iki insan grubu hiçbir zaman tam olarak eşit değildir, ancak ortalama1 = ortalama2'den daha iyi bir şey tahmin etmek için yeterli bilgiye sahip değilseniz)? Sınırlamalardan bahsetmeden istatistiksel önemi açıklamak zarar verebilir.
Flask

0

Deneyeceğim.

İlk önce ortalama verilere ve verilerin ne kadar değişken olduğuna göre bir p değeri hesaplarsınız. Daha fazla değişken, küçük bir p değeri elde etme olasılığı daha düşüktür. Öte yandan, örneğin, iki grubu karşılaştırıyorsanız, bunların ortalamaları arasındaki fark ne kadar büyük olursa, p değeri o kadar küçük olur.

Ayrıca, daha fazla veriye sahip olunarak verilerin değişkenliği bir şekilde iptal edilebilir. İki ortalama ve aynı miktarda değişkenlik arasında aynı farkla iki veri kümesini görüntüleme. Bu durumda, daha büyük numune boyutuna sahip set daha küçük p değerine sahip olacaktır.

Test kısmı sadece p-değerinin bir sayıdan düşük olup olmadığını görüyor. Genellikle insanlar .05 kullanır, ancak bu keyfi bir toplumsal adettir. Birçok insan keyfi bir sayı kullanmanın mantıklı olmadığını düşünüyor, ancak tarihsel nedenlerden dolayı çok yaygın.

Ayrıca, önem testinizin iki grup arasında bir fark olduğunu söylediği için, neden bu farkın olduğunu bildiğiniz anlamına gelmediğini unutmayın. Öte yandan, eğer test önemli bir fark olmadığını söylüyorsa, bunun nedeni değişkenliğinizin çok büyük olması ve düşük bir p değeri elde etmek için yeterli veriye sahip olmamanız olabilir, bu gerçek bir fark olmadığı anlamına gelmez.

Düzenle:

Özetlemek gerekirse, düşük p değeri, tahmine karşı daha fazla kanıt anlamına gelir:

Tahmin edilen sonuçtan fark -> Aşağı p değeri

Daha fazla veri -> Aşağı p değeri

Daha fazla değişkenlik -> Yukarı p değeri

P değerinin düşürülmesi, tahminin yanlış olduğunu söyleyen daha fazla kanıt anlamına gelir. Tarihteki her tahminin ondalık bir yere sahte olduğu gösterilmiştir.


0

İstatistiksel anlamlılık, belirli bir hipotezi kabul etmek veya reddetmek için gerekçe sağlamak için kullanılan bir kavramdır. Bir veri seti verildiğinde, bir analist istatistikleri hesaplayabilir ve farklı değişkenler arasındaki çeşitli ilişkilerin büyüklüğünü belirleyebilir.

İstatistiklerin işi, verilerin, hesaplanan istatistiklerin veya değişkenler arasında gözlenen ilişkilerin gerçek ifadeler olarak yorumlanabileceği veya örnek verilerinizde gözlemlenen sonuçların sadece şansa bağlı olup olmadığı sonucuna varmak için yeterli kanıt içerip içermediğini belirlemektir. Bu, sıfır hipotezi doğruysa, ancak sıfır hipotezi yanlışsa değil, belirli özellikler sergileyecek bazı örnek istatistiği belirlenerek yapılır. İlgili örnek istatistik, sıfır hipotezi altında beklenen özellikleri ne kadar çok gösterirse, sıfır hipotezinin doğru olduğuna dair istatistiksel kanıtlar o kadar güçlü olur. Benzer şekilde, örnek istatistik, sıfır hipotezi altında beklenen özellikleri ne kadar az gösterirse, sıfır hipotezinin doğru olduğuna dair istatistiksel kanıtlar zayıflar.

Örnek istatistiğin null altında beklenen özellikleri sergilediği miktar bir derece meselesidir, ancak null hipotezinin kabul veya reddedildiği sonucuna varmak için bazı keyfi kesimler olmalıdır. Bu haliyle, bir kesme değeri seçilir. Örnek istatistiği kesim değerinin içine veya bir tarafına düşerse, sıfır hipotezi altında beklenen özelliklere uyduğu söylenir ve bu nedenle sonuç, verilen kesme değeri için istatistiksel olarak anlamlı kabul edilebilir (örn.% 5 alfada) düzeyi). İlgili örnek istatistik, kesme değerinin diğer tarafına düşerse, sıfır hipotezi altında beklenen özelliklere uymadığı söylenir ve bu nedenle sonuç, verilen kesme değeri için istatistiksel olarak anlamlı kabul edilmez.


Ama ne sıklıkta orada gerçekten farklı bir nüfus sonuçları için geçerli gerekiyordu olduğunu önceden belirledi. Genellikle, sonucu çalışılan nüfusun ötesine uygulamak için bir argüman yapılır, bu eşsiz bir örnektir. Deneklerin bu eşsizliğinin / ne olursa olsun, birçok durumda bilinmemektedir. Bir istisna imalat kalite kontrolü olabilir, ancak önem testi bundan çok daha yaygın olarak kullanılır. Sadece kendi eğitimimden çıkarılan prosedürün sınırlarını vurgulamak istiyorum.
Flask

@ Şişe bu iyi bir nokta. Cevabımı daha genel hale getirmek için düzenledim.
tjnel
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.