İstatistik ve olasılıkların tümevarım ve tümdengelim gibi olduğunu söyleyebilir misiniz?


17

Bu konuyu okudum ve bana söylenebilir gibi görünüyor:

  • istatistik = indüksiyon?
  • olasılık = kesinti?

Ancak, karşılaştırmayla ilgili eksik olduğum bazı ayrıntılar olup olmadığını merak ediyorum. Örneğin, istatistikler tümevarım ile eşit mi, yoksa sadece belirli bir durum mu? Olasılığın bir alt kesinti vakası olduğu görülmektedir (çünkü matematiksel düşüncenin bir alt vakasıdır).

Bunun seçici bir soru olduğunu biliyorum, ama bir anlamda bu yüzden soruyorum - çünkü bu terimlerin nasıl doğru bir şekilde karşılaştırılabileceğinden emin olmak istiyorum.


Sorunuza cevap verdikleri için değil, bağlı oldukları için: stats.stackexchange.com/questions/665/… (Mark / Peter'ın cevabını gerçekten seviyorum) ve stats.stackexchange.com/questions/2641/…
robin

Yanıtlar:


15

Sorunuzu cevaplamadan önce tümevarımsal ve tümdengelimli akıl yürütmenin anlamını hızlı bir şekilde özetlemenin en iyisi olduğunu düşünüyorum.

  • Tümdengelimli Akıl Yürütme: "Tümdengelim argümanları, bir sonucun mutlaka bir dizi binadan geldiğini göstermeye çalışır. Tümdengelim argümanı, sonuç mutlaka tesislerden sonra geliyorsa, yani sonuçların doğru olması şartıyla doğru olması gerekiyorsa Tümdengelimli bir argüman geçerliyse ve onun önceliği doğruysa sağlamdır. Tümdengelimli argümanlar geçerli veya geçersiz, sağlam veya sağlamdır, ancak asla yanlış veya doğru değildir. " ( wikipedia'dan alıntı , vurgu eklendi).

  • "Tümevarım veya tümevarımsal mantık olarak da bilinen tümevarımsal akıl yürütme veya konuşma dili İngilizcesinde eğitimli tahmin , tüm tesislerin doğru olduğu yerlerde bile sonucun yanlış olması olasılığını sağlayan bir tür akıl yürütmedir. Tümevarımsal bir mantıksal argümanın öncülleri. sonuç için bir dereceye kadar destek (endüktif olasılık) gösterir, ancak bunu gerektirmez; yani, gerçeğini sağlamazlar. "( wikipedia'dan vurgu eklendi)

Temel farkı vurgulamak için: Tümdengelimli akıl yürütme, gerçeği tesislerden sonuçlara aktarırken, tümevarımsal akıl yürütme yapmaz. Yani, tümdengelimli akıl yürütme için bilginizi asla genişletmezsiniz (yani, her şey tesislerde bulunur, ancak bazen gizli ve kanıtlarla gösterilmesi gerekir), tümevarımsal akıl yürütme bilginizi genişletmenize izin verir (yani, Bununla birlikte, gerçeklerini bilmemenin maliyeti nedeniyle tesislerde zaten yer almazlar).

Bu olasılık ve istatistiklerle nasıl ilişkilidir?

Gözlerimde, olasılık mutlaka tümdengelimli. Matematiğin bir dalıdır. Bu yüzden bazı aksiyomlara veya fikirlere (sözde doğru olanlar) dayanarak teorileri çıkarır.

Bununla birlikte, istatistikler mutlaka tümevarımsal değildir. Sadece gözlemlenmeyen varlıklar hakkında bilgi üretmek için kullanmaya çalışırsanız (yani, çıkarımsal istatistiklerin peşinden koşmak için, aynı zamanda yanıtın cevabına da bakınız). Bununla birlikte, örneği tanımlamak için istatistikleri kullanırsanız (yani, tanımlayıcı istatistikler) veya tüm popülasyonu örneklediyseniz, örnekte zaten mevcut olandan daha fazla bilgi veya bilgi alamadığınız için hala tümdengelimdir.

Yani, istatistikleri, dünyadaki ampirik varlıkların etkileşimini yöneten düzenleri bulmak için matematiksel yöntemleri kullanmaya çalışan bilim adamlarının kahramanca çabaları olarak düşünürseniz, aslında asla başarılı olmaz (yani, teorilerimiz doğrudur), o zaman, evet, bu tümevarımdır. Aynı zamanda üzerine modern ampirik bilimin kurulduğu Francis Bacon tarafından ifade edilen Bilimsel Yöntem. Yöntem, kesin olmasa da, en iyi şekilde muhtemel olan endüktif sonuçlara yol açar. Bu da bilim olmayanların bilimsel bir teorinin ve bilimsel kanıtın anlamı hakkında yanlış anlamalara yol açar.


Güncelleme: Konjugat Öncesi'nin cevabını okuduktan sonra (ve bir gecede düşündükten sonra) bir şey eklemek istiyorum. (Çıkarımsal) istatistiksel akıl yürütmenin tümdengelimci veya tümevarımcı olup olmadığı sorusunun tam olarak neyle ilgilendiğinize, yani ne tür bir sonuca çalıştığınıza bağlı olduğuna inanıyorum.

Olasılıksal sonuçlarla ilgileniyorsanız, istatistiksel akıl yürütme tümdengelimseldir. Bu, örneğin 100 vakadan 95'inde nüfus değerinin belirli bir aralıkta (yani güven aralığı) olup olmadığını bilmek istiyorsanız, bu ifade için bir doğruluk değeri (doğru veya doğru değil) alabilirsiniz. (Varsayımlar doğruysa), 100 vakadan 95'inde nüfus değerinin aralık dahilinde olduğunu söyleyebilirsiniz. Ancak, hiçbir ampirik durumda, popülasyon değerinin elde ettiğiniz CI'nizde olup olmadığını bilemezsiniz. Ya öyle ya da değil, ama emin olmanın bir yolu yok. Aynı mantık klasik p değeri ve Bayesci istatistiklerde olasılıklar için de geçerlidir. Olasılıklardan emin olabilirsiniz.

Bununla birlikte, ampirik varlıklar hakkında sonuçlarla ilgileniyorsanız (örneğin, nüfus değeri nerede) sadece endüktif olduğunu iddia edebilirsiniz. Ampirik varlıklar veya etkileşime girdikleri nedensel mekanizmalar hakkında belirli önermeleri destekleyen kanıtları toplamak için mevcut tüm istatistiksel yöntemleri kullanabilirsiniz. Ancak bu önermelerden hiçbir zaman emin olmayacaksınız.

Özetlemek gerekirse: Aradığın noktada önemli olduğunu vurgulamak istediğim nokta. Olasılıklar çıkarabilirsin, ama şeyler hakkındaki her kesin öneri için sadece lehine kanıt bulabilirsin. Daha fazla değil. Ayrıca bkz. Onestop'un indüksiyon problemi ile olan bağlantısı.


Teşekkürler Henrik - tanımlar (ve onlar hakkında düşünceleriniz) arasındaki ayrım yardımcı oldu.
Tal Galili

Güncellemeniz açık ve netti. Sana başka bir (+1) verebilirsem, yapardım.
Tal Galili

7

İstatistik tümevarım için tümdengelimsel yaklaşımdır. İstatistiksel çıkarımda iki ana yaklaşımı düşünün: Frequentist ve Bayesian.

Bir Frequentist olduğunuzu varsayalım (rahatlık için Neyman yerine Fisher tarzında). Önemli bir ilgi parametresinin belirli bir değer alıp almadığını merak edersiniz, bu nedenle bir model oluşturur, parametreyle ilgili bir istatistik seçer ve bir test gerçekleştirirsiniz. Testiniz tarafından üretilen p değeri, modelinizin doğru olduğu varsayılarak, bir istatistiğe sahip olduğunuz örnekten hesaplanan istatistikten daha yüksek veya aşırı uç görme olasılığını gösterir. Yeterli küçük bir p değeri elde edersiniz, böylece parametrenin bu değeri alması hipotezini reddedersiniz. Akıl yürütmeniz tümdengelimseldir: Modelin doğru olduğu varsayılarak, ya parametre gerçekten büyük bir ilginin değerini alır, ancak sizinkinin görülmesi olası olmayan bir örnektir ya da aslında bu değeri almaz.

Hipotez testinden güven aralıklarına dönme: parametreniz için% 95 güven aralığınız var. Akıl yürütmeniz yine tümdengelimseldir: modelin doğru olduğu varsayılarak, bu, parametrenin gerçekten önemli bir ilgi değerine sahip olduğu durumlarda 20 kez 1'de görünecek nadir aralıklardan biridir veya örneğiniz beklenmedik bir değerdir). parametresi aslında bu değere sahip değildir.

Şimdi bir Bayesian olduğunuzu varsayın (Gelman yerine Laplace tarzında). Model varsayımlarınız ve hesaplamalarınız, parametre değeri üzerinde size (arka) bir olasılık dağılımı verir. Bu dağılımın kütlesinin çoğu, önemli faiz değerinden uzaktır, bu nedenle parametrenin muhtemelen bu değere sahip olmadığı sonucuna varırsınız. Muhakemeniz yine tümdengelimseldir: modelinizin doğru olduğunu varsayarsak ve önceki dağılım parametre hakkındaki inançlarınızı temsil ediyorsa, veriler ışığında bu konudaki inançlarınız, o değere çok az olasılık getiren posterior dağılımınızla açıklanır. Bu dağıtım, önemli faizlerin değeri için çok az destek sunduğundan, parametrenin aslında değere sahip olmadığı sonucuna varabilirsiniz. (Ya da olasılığını belirtmek için memnun olabilirsiniz).

Her üç durumda da, eyleminizi varsayımlardan tümdengelimsel / matematiksel olarak türetilen eyleminize dayandırmak için mantıklı bir kopukluk elde edersiniz. Bu varsayımlar genellikle verinin nasıl oluşturulduğuna dair bir model ile ilgilidir, ancak diğer miktarlar hakkında önceki inançlar da olabilir.


1
Teşekkürler Cp, ilginç bir noktaya değindin. Her ne kadar Henrik'in yukarıdaki cevabı açısından, hala endüktif alemdesiniz, çünkü tanımladığınız istatistiksel akıl yürütme belirsizliği içeren bir sorundur.
Tal Galili

Lütfen burada ortaya çıkan sorunu gidermeye çalıştığım cevabımın (umarım anlaşılabilir) güncellemesine bakın.
Henrik

@Henrik Bu daha net (en azından benim için). Sadece küçük bir eleyip sıkma: "Aynı mantık klasik p-değeri ve Bayesci istatistiklerde olasılıklar için de geçerli değildir". İkincisi olacak size tek olay olasılıklarını, gerçek ortalama rağmen (diğer uyarılar tüm uygulamak rağmen) güvenlik aralıkları gibi 'klasik' frequentist yöntemler bile yapamıyorsun olurken bazı değer ve bazı diğer değer arasında olduğunu örn olasılık vermek düşkün ve yaygın umut yapıyorlar. Onların yorumları aslında sizin tanımladığınız gibidir.
konjugateprior

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.