Tanımlayıcı istatistikleri raporlamanın amacı nedir?


21

Lojistik regresyon kullanarak verilerimin bir analizini yaptım, ancak raporumda açıklayıcı bir İstatistik bölümüne de ihtiyacım var. Dürüst olmak gerekirse bu konuyu anlamıyorum ve birinin neden gerekli olduğunu açıklayabileceğini umuyordum.

Örneğin, bağımsız sürekli değişkenlerimden birinin histogramını çizersem ve normallik gösterirse ya da eğriliği gösteriyorsa, bu rapora nasıl bir değer katacaktır?

Verilerim, doğru ya da yanlış bir işe girme bağımlı değişkenlerinden oluşmakta ve bağımsız değişken, orta vadedeki notları, final sınavlarında notları ve erkek ya da kadınları içermektedir.


IV'lerin histogramını çizmede herhangi bir değer göremiyorsanız, o zaman bunu yapmamalısınız, ancak topladığınız ve sunduğunuz çalışmaya değer verdiğini düşündüğünüz herhangi bir veri var mı? rapor?
Ian_Fin

Merhaba Ian, sorunumla ilgili daha fazla ayrıntı ekledim. İstatistikler konusunda oldukça yeniyim ve merak ediyorum, lojistik regresyon yapmadan önce aldığımız genel bir yaklaşımın olup olmadığını merak ediyorum.
user3223190

Ayrıca, verilerin çeşitli alanlarına bakmayı ve muhtemelen eklemeyi de öneririm. Örneğin, final notu vs cinsiyete göre renk kodlu ve "kodlu iş" ve "iş bulamadı" sembolleriyle kodlanan orta vadeli notu çizebilirsiniz.
Emil M Friedman

Yanıtlar:


42

Alanımda, raporun tanımlayıcı kısmı son derece önemlidir çünkü sonuçların genelleştirilebilirliğinin bağlamını belirler. Örneğin, bir araştırmacı hastaneden bir örnekte motosiklet kazalarını takiben travmatik beyin hasarı tahminlerini tanımlamak istemektedir. Bağımlı değişkeni ikilidir ve bir dizi bağımsız değişkene sahiptir. Çok değişkenli lojistik regresyon, aşağıdaki bulguları üretmesine izin verdi:

  • kask kullanımı ayarlanmamış, kask kullanımına göre OR = 4.5 (% 95 CI 3.6, 5.5).
  • diğer tüm değişkenler nihai modele dahil edilmedi.

Açık olmak gerekirse, modellemeyle ilgili hiçbir sorun yoktu. Tanımlayıcı istatistiklerin ekleyebileceği değere odaklanıyoruz.

Tanımlayıcı istatistikler olmadan, bir okuyucu bu bulguları perspektife koyamaz. Niye ya? Size açıklayıcı istatistikleri göstereyim:

age, years, mean (SD)                  54 (2)
males, freq (%)                       490 (98)
blood alcohol level, %, mean (SD)    0.10 (0.01)
...

Yukarıdan, örneğinin yaşlı, sarhoş erkeklerden oluştuğunu görebilirsiniz. Bu bilgilerle okuyucu, eğer varsa, genç erkeklerde yaralanmalar ya da sarhoş olmayan sürücülerdeki ya da kadın sürücülerdeki yaralanmalar hakkında söyleyebilecekleri söyleyebilir.

Lütfen açıklayıcı istatistikleri göz ardı etmeyin.


5
Güzel bir örnek. Gerçek mi yoksa telafi mi?
amip diyor Reinstate Monica

5
Teşekkürler, @amoeba. Sayılar ve istatistikler gerçek. Ancak, masum olanı korumak için konuyu travmatik beyin hasarı olarak değiştirdim.

3
Öyleyse, sarhoş adamlar kasksız motosiklet kullanıyorlardı ... Kim travmatik bir beyin hasarı ile kurtulabileceğini düşünürdü?
dediklerinin - Eski Monica

O zamanlar bir bardak Avustralya

25

Tanımlayıcı istatistikler sunmanın amacı, örneğinizi diğer merkezlerdeki veya ülkelerdeki kişilerin sonuçlarınızın durumlarına göre genel olup olmadığını değerlendirmelerini sağlayacak şekilde nitelemektir. Bu yüzden, cinsiyetini, notlarını ve benzerlerini sıraya koymak, lojistik regresyona faydalı bir katkı olacaktır. İnsanların varsayımlarınızı kontrol etmelerine izin vermemekle birlikte, bunu yapmaya çalışabilirler.

============== Sağlıkta kullanılan bazı kurallara bağlantılar vermek için düzenleyin.

Aşina olduğum alanda, sağlık, raporlama için özel kurallar var. Bunlar, EQUATOR ağında , güncel detaylar için istişare edilmesi gereken bir araya toplanmıştır .

Örnek olarak, ilgili kılavuzun CONSORT olduğu klinik denemeler yapabiliriz. Burada ve başka yerlerde mevcut olan kılavuzun ana hatlarını gösteren belgede Tablo 1 tavsiyesi 15'te okuduk. "Her grup için temel demografik ve klinik özellikleri gösteren bir tablo".

Diğer çalışma türleri için benzer tavsiyeler var.


Teşekkürler mdewey, bu yüzden çeşitli tanımlayıcı arsaları yaptığımızda ve normalliği veya çarpıklığı fark edersek, neden sadece bunun hakkında yorum yapalım. Temel olarak, tanımlayıcı istatistikler sadece okuyucuyu çalıştığınız veriler hakkında okuyucuyu bilgilendirmek için kullanır. Bu çok basit görünebilir, gerçekten üzgünüm
user3223190

En aşina olduğum sağlık alanında çalışma şekli budur.
mdewey,

8
+1. İlk başta “diğer merkezlerde veya ülkelerde” “diğer yüzyıllarda” olarak yanlış anladım.
amip diyor Reinstate Monica

4

Başka bir şey değişkenlerinizin ne kadar iyi davrandığını göstermektir. Örneğin, değişkenlerinizden biri maaş ise ve tam olarak bir milyarder ile röportaj yapmışsanız, maaşını lojistik regresyona girdiğinizde her şeyden üstün olacaksa, maaşınızı görmezden gelmeyi öğreneceksiniz. ne kadar gerçek bilgiyi tutabileceği.

Bazı yöntemler, çarpıklık ve aşırı değerlere karşı diğerlerinden daha hassastır ve lojistik regresyon daha hassas taraftadır. Tabii ki, son kanıt pudingtedir ve elde edilen sonuçları ham verilerle veya normalliğe dönüştürülmüş her bir özellikle karşılaştırabilirsiniz.


1

Açıklayıcı bir kısım, okuyucuyu veri kümenizi anlamaya yardımcı olur. Uygulanan ekonda, analizinizdeki ilk potansiyel kusurları gösterebileceği için genellikle şiddetle tavsiye edilir.

Tanımlayıcılarınızı patlatmak için farklı kaynaklardan gelen verileri kullanabilirsiniz.

1 masa yeterli olmalı. Bağladığın kişi pek sezgisel değil.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.