Tanımlayıcı ve çıkarımsal istatistik arasındaki fark nedir?


21

Anladığım kadarıyla tanımlayıcı istatistikler, bir veri örneğinin özelliklerini nicel olarak tanımlarken, çıkarımsal istatistikler örneklerin alındığı popülasyonlar hakkında çıkarımlar yaptı.

Ancak, istatistiksel çıkarım için wikipedia sayfası şöyledir :

Çoğunlukla, istatistiksel çıkarım, bir grup rastgele örneklemeyle ilgi popülasyonundan elde edilen verileri kullanarak, popülasyonlar hakkında önerilerde bulunur.

“Çoğunlukla”, bu kavramları belki de doğru anlamadığımı düşünmemi sağladı. Popülasyonlar hakkında öneride bulunmayan çıkarımsal istatistik örnekleri var mı?


Tanımlayıcı istatistikler: Bir madeni para on kez atıldı ve altı kez baş aşağı indirildi. İstatistiksel çıkarsama: Başkanları olasılığı maksimum olabilirlik tahmini Bu bilgiler sikke adil bir jeton olduğu hipotezini reddetmek için yetersiz, ya da. 0.6
Dilip Sarwate

2
"Nüfus" kavramı olmadan çıkarım: Verilerinizin (kısmen) bilinmeyen rastgele bir mekanizma / kural tarafından üretildiğini varsayalım. Çıkarımsal yöntemler verilere dayanarak bu mekanizmanın özelliklerini değerlendirmeye izin verir. Örnek: Sadece yaklaşık olarak veya kusurlu koşullar altında ölçülebilen sonuçlara dayanarak elektro-fiziksel bir formül doğrulamak istiyorsunuz.
Michael M

1
@Michael: Evet; ya da verilerinizi bilinen rastgele bir mekanizma tarafından üretilir hale getirin - deneysel tedavilerin rastgele atanması.
Scortchi

Yanıtlar:


19

Davranış bilimleri arkaplanından gelince, bu terminolojiyi özellikle giriş istatistiği ders kitapları ile ilişkilendiririm. Bu bağlamda ayrım şudur:

  • Tanımlayıcı istatistikler , verilerin bazı özelliklerini tanımlamak için kendinden ilginç olan örnek verilerin işlevleridir. Klasik tanımlayıcı istatistikler ortalama, min, maks, standart sapma, medyan, çarpıklık, kurtozu içerir.
  • Çıkarımsal istatistikler , popülasyon parametresiyle ilgili bir hipotezle ilgili çıkarımda bulunmanıza yardımcı olan örnek verilerin bir fonksiyonudur. Klasik çıkarımsal istatistikler z, t, , F oranı vb. İçerir .χ2

Önemli olan nokta, herhangi bir istatistik, çıkarımsal veya açıklayıcı, örnek verinin bir fonksiyonudur. Bir parametre, popülasyon teriminin, temel veri oluşturma işlemini söylemekle aynı olduğu popülasyonun bir fonksiyonudur.

Bu açıdan bakıldığında, verinin belirli bir işlevinin tanımlayıcı veya çıkarımsal bir istatistik olarak durumu, onu hangi amaçla kullandığınıza bağlıdır.

Bununla birlikte, bazı istatistikler verilerin ilgili özelliklerini açıklamada açıkça daha faydalıdır ve bazıları çıkarsamaya yardımcı olmak için çok uygundur.

  • Çıkarımsal istatistikler: Boş hipotezin yanlış olduğu belirli bir veri üretme işlemi için t ve z gibi standart test istatistikleri, beklenen değer, örneklem büyüklüğünden kuvvetli bir şekilde etkilenir. Araştırmacıların çoğu, içsel ilgi popülasyonu parametresini tahmin etme gibi istatistikleri görmeyeceklerdir.
  • Tanımlayıcı istatistikler : Buna karşılık tanımlayıcı istatistikler, tipik olarak kendine özgü ilgi çekici popülasyon parametrelerini tahmin eder. Örneğin, örnek ortalama ve standart sapma, eşdeğer popülasyon parametrelerinin tahminlerini sağlar. Minimum ve maksimum gibi tanımlayıcı istatistikler bile, eşdeğer veya benzer popülasyon parametreleri hakkında bilgi sağlar, ancak bu durumda elbette, çok daha fazla dikkat gerekir. Ayrıca, birçok tanımlayıcı istatistik önyargılı olabilir veya ideal tahmin edicilere göre daha düşük olabilir. Ancak, yine de ilgilenilen bir popülasyon parametresini tahmin etmede bazı faydaları vardır.

Dolayısıyla bu açıdan, anlaşılması gereken önemli şeyler şunlardır:

  • istatistik : örnek verinin işlevi
  • parametre : popülasyonun işlevi (veri oluşturma süreci)
  • tahmincisi : Bir parametrenin tahminini sağlamak için kullanılan örnek verilerin fonksiyonu
  • çıkarım : bir parametre hakkında sonuca varma süreci

Böylece, istatistiği kullanan araştırmacının amacına bağlı olarak tanımlayıcı ve çıkarımsal arasındaki ayrımı tanımlayabilir veya tipik olarak nasıl kullanıldığına bağlı olarak bir istatistik tanımlayabilirsiniz.


Çıkarımsal istatistiklerin t veya F puanlarının (ör. T- testleri yerine) çağrılması nasıl doğrulanır ?
jona

@jona t-skoru t-testinde kullanılan “istatistik” tir, dolayısıyla t-skoru böyle bir çıkarımsal sürecin bir parçası olarak kullanıldığında çıkarımsal bir istatistik olarak tanımlanabilir. Sanırım bir istatistiğin verinin bir fonksiyonu olduğu varsayımıyla başladım. Fakat belki de, çıkarımsal istatistiklerden genellikle çıkarım yapmak için kullanılan daha geniş teknikler kümesi olarak düşündüğümüz noktaya değiniyorsunuzdur?
Jeromy Anglim

Farklı ifade etmeme izin verin - t-istatistiği çıkarımsal bir ifade yerine (p-değeri gibi) bir örneğin tanımı değil midir?
jona

Evet, verinin bir işlevi, bir örneğin açıklamasına eşdeğerdir. Sanırım bu tür istatistiklerin çıkarımsal bir süreçte kullanıldığını düşünüyordum (örneğin, araştırmacılar bir t-değeri elde etmek için t-istatistiğini bir t-dağıtımıyla ilişkilendirir ve daha sonra p-alfa ile bir çıkarım çizmek için ilişkilendirir). Sık sık ders kitapları bu örnekleri kullandığını gördüm. Ancak, p-değerinin ve ikili çıkarımın kendisinin istatistik olarak görülebileceğini (örneğin, örnek verinin fonksiyonları) olduğunu varsayalım. İkili çıkarımın kendisinin çıkarım ile en net şekilde hizalandığı görülebilir. Aldığın şey bu mu?
Jeromy Anglim

1
Yani, örneğin, sen almak için verileri kullanmak t olanağı sunan bir dağıtım ile ilgilidir p sırayla nüfus parametresi hakkında bir ikili çıkarım verir. Dolayısıyla, sıkça bir bakış açısıyla, t, p ve ikili çıkarımın tümü rastgele değişkenlerdir. Hepsi çıkarım sürecine dahil edildi. Avantaj ve dezavantajların ne olduğunu ya da sadece çıkarımsal olarak bazı istatistiklerin etiketlendiğinden emin değilim.
Jeromy Anglim

8

Bir çıkarım biçimi, deneysel tedavilerin rastgele atanmasına dayanır ve bir popülasyondan (hatta varsayımsal olarak) rastgele örneklemeye dayanmaz. Oscar Kempthorne bir savunucuydu.

ABtt10/252=0.04

Tahmin, nüfuslarla ilgili önermeleri formüle etmeniz gerekmeyen başka bir alandır. (Herkesin "tahmin" çıkarımı olarak adlandırmak isteyeceğini bilmiyorum, ama Geisser (1993), Tahmini Çıkarım: Bir Giriş ). Genellikle tahmin, yerleştirilmiş bir popülasyon modelinden kaynaklanır, ancak her zaman değil; örn. @ Matt'in sınıflandırma örneği, model ortalaması (Bayesian veya Akaike ağırlıklarına göre) veya üstel düzleştirme gibi tahmin algoritmaları.

NB "Çıkarımsal ve betimleyici istatistikler" in daha çok, örneklerden hesaplanan miktarlardan ziyade disiplin İstatistikleri ile ilgili olduğunu düşünüyorum. Çıkarımsal ve betimleyici bir istatistik arasında önemli bir fark yoktur; @ Jeremy'nin belirttiği gibi, onu kullanmaya başlamanızın bir önemi var.


2

Sınıflandırmanın mutlaka veri noktalarının toplandığı nüfus (lar) hakkında bir açıklamada bulunduğundan emin değilim. Sınıflandırma, muhtemelen bildiğiniz gibi, diğer etiketlenmemiş özellik vektörlerine ait sınıf etiketlerini tahmin etmek için her biri belirli bir sınıfla etiketlenmiş bazı "özellik" vektörlerinden oluşan eğitim verilerini kullanır. Örneğin, diğer hastaların sağlıklı mı yoksa hasta mı olduğunu tahmin etmek için hastanın yaşamsal belirtilerini ve doktorun teşhisini kullanabiliriz.

P(class=c|features)c

Ancak, diğer sınıflandırıcılar sınıfları kendileri modellemeden sınıflar arasındaki farklılıkları ararlar; bunlara ayrımcı sınıflandırıcılar denir. Klasik bir örnek, en yakın komşusunun sınıfına etiketlenmemiş bir örnek atayan en yakın komşu sınıflandırıcısıdır (burada sorun için mantıklı bir şekilde tanımlanır). Bu, eğer varsa, veri noktalarının çizildiği popülasyonlar hakkında bilgi içermiyor gibi gözüküyor.

t


0

Bir satırda, veriler göz önüne alındığında, tanımlayıcı istatistikler, verilerinizin içeriğini minimum bilgi kaybıyla (hangi önlemi kullandığınıza bağlı olarak) özetlemeye çalışır. Verilerin coğrafyasını görebiliyorsunuz. (Bir şey gibi, sınıfın performans grafiğini görün ve kimlerin üstte, altta vb. Olduğunu söyleyin)

Bir satırda, veriler göz önüne alındığında, verilerin geldiği varsayımsal popülasyonun özelliklerini tahmin etmeye ve çıkarmaya çalışın. (Birincisi, 7. sınıftaki öğrencileri sınıfın iyi örneklerinden anlamak, altta yatan popülasyonun toplamda onları hesaba katamayacağınız kadar büyük olduğu varsayılarak)


3
Asgari bilgi kaybı için amaçlayan tanımlayıcı istatistiklerin bir tanımlaması ya da karakterizasyonu olduğunu sanmıyorum. Gerçekten önemli detayları ortaya çıkaran tanımlayıcı istatistiklere sahip olmak tamamen mümkündür ve bu genellikle bir problemdir.
Nick Cox

0

Kısacası

Tanımlayıcı istatistikler , verileri anlamlı bir şekilde tanımlayan, gösteren veya özetleyen verilerin analizidir; bu sadece verilerimizi tanımlamanın / tüm nüfus hakkında konuşmamızın bir yoludur. bazıları merkezi eğilim ölçüleri ve dağılım ölçüleridir.

Çıkarımsal istatistikler , numunelerin çizildiği popülasyonlar hakkında genellemeler yapmak için örnekleri kullanmamızı sağlayan tekniktir. Örnek hipotez testleri ve


0

betimsel istatistikler, verileri anlamlı bir şekilde tanımlayan, gösteren veya özetleyen verilerin analizidir; bu sadece verilerimizi tanımlamanın / tüm nüfus hakkında konuşmamızın bir yoludur. bazıları merkezi eğilim ölçüleri ve dağılım ölçüleridir.

Çıkarımsal istatistikler, numunelerin çizildiği popülasyonlar hakkında genellemeler yapmak için numuneleri kullanmamıza izin veren bir tekniktir.


Doğrulanmış Cross'a Hoşgeldiniz ! Lütfen turumuzu görmek için bir dakikanızı ayırın . İyi bir cevabı bitirmek üzereydin ama bir şey oldu. Düşüncenizi tamamlamak için cevabınızı düzenlemekten çekinmeyin. Ayrıca, buraya koyduğunuz şeyle işbirliği yapan alıntılar / referanslar ekleyerek cevabınızı geliştirmek isteyebilirsiniz. "Nüfuslar hakkında teklifte bulunmayan çıkarımsal istatistik örnekleri var mı?" Sorusuna da cevap vermeniz gerekiyor.
Tavrock
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.