Tahmin ve çıkarım arasındaki fark nedir?


37

" İstatistiksel Öğrenmeye Giriş " i okuyorum . Bölüm 2'de, fonksiyonunu tahmin etmenin nedenini tartışırlar .f

2.1.1 Neden Tahmini ?f

Biz tahmin etmek isteyebilir iki ana nedeni vardır f : tahmin ve çıkarsama . Her birini sırayla tartışıyoruz.

Birkaç kez okudum, ama tahmin ve çıkarım arasındaki farkı hala kısmen belirsizim. Birisi farklılıkların (pratik) bir örneğini sunabilir mi?


5
İstatistiksel Öğrenmeye Giriş'in yazarları bize burada bir kötülük yaptı. Kişi, öngörüleri yapmak için çıkarımlarda bulunur, tıpkı nedenleri ve etkilerini anlamak için çıkarımlarda bulunur. Merriam-webster.com "infer" ı esas olarak "gerçeklerden veya binalardan bir sonuç olarak türetmek" olarak tanımlar. Bu hem nedensel hem de öngörücü akıl yürütmeyi kapsar. Sadece nedensellik konularını içerecek şekilde “çıkarım” tanımını daraltmak için yanıltıcı, kafa karıştırıcı ve uzun süreli standart kullanıma karşıdır. Öyleyse: öngörücü çıkarımı nedensel çıkarım ile karşılaştıralım.
rolando2

2
@ rolando2: Öyleyse , açıklayıcı (nedensel olmayan) modellerde parametreler hakkında çıkarım yapan , yani açıklayıcı çıkarımıza ihtiyacımız olduğunu düşünüyorum.
kjetil b halvorsen

Yanıtlar:


29

Çıkarım: Çıktının verinin bir fonksiyonu olarak nasıl üretildiğini anlamak istediğiniz bir veri kümesi göz önüne alındığında.

Tahmin: Yeni bir ölçüm yapıldığında, doğru tanımlayıcıyı bir dizi sonuçtan güvenilir bir şekilde seçen bir model oluşturmak için mevcut bir veri setini kullanmak istersiniz.


Çıkarım: Yaş, Yolcu Sınıfı ve Cinsiyet'in Titanik Felaket'te hayatta kalma üzerindeki etkisinin ne olduğunu bulmak istiyorsunuz. Lojistik bir regresyon oluşturabilir ve her bir yolcu özelliğinin hayatta kalma oranları üzerindeki etkisini anlayabilirsiniz .

{lives,dies}


Öngörü, girdi ve çıktı arasında en doğru ilişkiyi kurma etrafında dönmez, doğru tahmin, yeni gözlemleri mümkün olduğunca sık olarak doğru sınıfa koymayı önemser.

Bu nedenle, 'pratik örnek' kabaca aşağıdaki farklılığa kadar kaymaktadır: Tek bir yolcu için bir yolcu verisi kümesi göz önüne alındığında, çıkarım yaklaşımı size hayatta kalma olasılığını verir, sınıflandırıcı size yaşamlar veya ölümler arasında bir seçenek sunar.

Sınıflandırıcıları ayarlamak, p-değerlerini ve güven aralıklarını doğru yorumlamakla aynı şekilde çok ilginç ve önemli bir konudur.


1
İyi cevap. Ancak bazı insanlar “çıkarım” kelimesini duyduğunda “nedensel çıkarım” olarak düşünürler. ISLR buna odaklanmamış olsa da, bunun hakkında da bir şeyler söylemek isteyebilirsiniz.
generic_user 3:16

1
Bence derin öğrenme dünyasında çıkarım, tahmin ile hemen hemen aynıdır. blogs.nvidia.com/blog/2016/08/22/…
user1893354

1
Bu bana çok iyi bir cevap gibi görünüyor.
gung - Reinstate Monica

3
Bu cevabın yanlış olduğuna inanıyorum, özellikle “çıkarım yaklaşımı size hayatta kalma olasılığını veriyor, sınıflandırıcı size yaşamları ya da ölümler arasında bir seçenek sunuyor”, hatta daha özel olarak da ilk kısmı. Bir yolcunun hayatta kalma olasılığını hesaplamak, bir tahmin, özellikle de olasılıklı bir tahmindir. Sürekli durumda bir yoğunluk tahmini olacaktır. Öyleyse , zor bir sınıflandırma elde etmek için bu öngörülen olasılığı eşiklendirebiliriz , evet. ...
S. Kolassa - Monica

3
... Oysa tahmin, sonuçları tahmin etmekle ilgili olsa da , çıkarım girdilerin sonucla ilişkisini anlamakla ilgilidir : hangi girdi böyle bir ilişkiye sahiptir ve "gerçek" bir ilişkiyi rasgele eş değişkenlikten (p değerlerinin olduğu yer) nasıl ayırt edebiliriz? içeri gel)? Birisi bana nerede olduğumu açıklayabilir mi?
S. Kolassa - Monica

11

Genellikle veri analizi yaparken, verilere yol açan bir tür "veri üretme süreci" olduğunu hayal ediyoruz ve çıkarım bu sürecin yapısı hakkında bir şeyler öğrenmeyi ifade ederken, tahmin, kendisinden gelen verileri tahmin edebilmek anlamına geliyor. . Çoğu zaman ikisi birlikte gider, ama her zaman değil.

İkisinin el ele gittiği bir örnek, basit doğrusal regresyon modeli olacaktır.

Yi=β0+β1xi+ϵi.

β0β1


3
"ancak modelin sahne arkasında neler olduğu konusunda anlamlı bir kavrayışa yol açması gerekmez." " Kara kutu " terimi akla geliyor. :)
Alexis

veya çok katmanlı sinir ağları
Şihab Şahriar Han

“Ancak, birinin mantıklı tahminler yapabileceği başka modeller de var, ancak bu model sahnelerin arkasında ne olduğu konusunda anlamlı bir içgörüye yol açmıyor.”, Kimin umrunda? Çıkarım sorunu, sizin tanımladığınız gibi, hala modelin parametrelerini belirleyenlerden biridir. Bu cümleyi neden "Ama" ile başlattığını ve neden bu cümleyi kendi çıkarım ve tahmin tanımlarına göre yazdığını anlamıyorum.
nbro

1
"Ama" kullanımı, önceki ve sonraki modellerin her ikisinin de tanımının doğru olması nedeniyle, ancak aşağıdaki model, öngörme ve çıkarım arasındaki farkı kavrayana kadar beklemeyeceğiniz şekilde, eskinin doğasından farklıdır. bu gösteriliyor. Şimdiden ayrımcılıkla aşinayım, yine de bu örneği içgörülü ve yararlı buluyorum. +1
gung - Reinstate Monica

10

Kitabın 20. sayfasında, yazarlar beni farkı anlatan güzel bir örnek sunuyor.

İşte kitaptaki paragraf: İstatistiksel Öğrenmeye Giriş

" Örneğin , bir emlak ortamında, evlerin değerleri, suç oranı, imar, bir nehirden uzaklık, hava kalitesi, okullar, toplumun gelir düzeyi, evlerin büyüklüğü gibi girdilerle ilişkilendirilebilir. Bu durumda, bireysel girdi değişkenlerinin fiyatları nasıl etkilediğiyle ilgilenilebilir - yani, eğer bir nehrin manzarasına sahipse bir evin değeri ne kadar olacak? Bu bir çıkarım problemidir . Bir evin değerini kendi özelliklerine göre tahmin ederken: Bu evin değeri düşük mü yoksa aşırı mı? Bu bir tahmin problemidir . ”


5

ytx1,tx2,t

yt=f(x1,t1,x2,t1)+εt

Şimdi, eğer gelirle ilgili verileri alırsanız, BEA'dan kişisel tek kullanımlık gelir serileri söyleyin ve yıl değişkeninin zamanını oluşturun, f işlevini tahmin edebilir , daha sonra nüfus gelirinin en son değerlerini ve yılın saatini buna dahil edebilirsiniz. işlevi. Bu, mağazanın gelirinin bir sonraki çeyreği için tahminde bulunacaktır.

f/x2tβ2x2,t1

xTahmin edicinin etkisini diğer tahmin edicilerin etkisinden ayırmak daha zordur. Tahmin için bu önemli değil, tek umursadığınız tahminin kalitesidir.


3

Düşünün, yoğun bir bakım ünitesinde tıbbi bir doktorsunuz. Güçlü ateşi ve belirli sayıda kan hücresi, belirli bir vücut ağırlığı ve yüzlerce farklı verisi olan bir hastaya sahipseniz, hayatta kalabileceklerini tahmin etmek istersiniz. Eğer öyleyse, diğer çocuğuyla ilgili bu hikayeyi karısına gizleyecek, eğer olmasa da, açıklayabilmesi için onun için önemlidir.

Doktor, bu öngörüyü, birimindeki eski hastaların verilerine dayanarak yapabilir. Yazılım bilgisine dayanarak, genelleştirilmiş bir doğrusal regresyon (glm) veya bir sinir ağı (nn) kullanarak tahmin edebilir.

1. Genelleştirilmiş Doğrusal Model

Bir sonuç elde etmek için glm için pek çok ilişkili parametreler vardır, bu nedenle doktorun varsayımlar yapması (doğrusallık vb.) Ve hangi parametrelerin etkisi olacağı konusunda kararlar vermesi gerekecektir. Glm onu, parametrelerinin her biri için anlamlı bir t testi ile ödüllendirecek, böylece cinsiyet ve ateşin önemli bir etkiye sahip olduğu, vücut ağırlığının mutlaka olması gerektiği gibi güçlü kanıtlar toplayabilecektir.

2. Sinir ağı

Sinir ağı, eski hasta örneğindeki tüm bilgileri yutacak ve sindirecektir. Tahmin edicilerin korelasyon gösterip göstermediği önemli değildir ve vücut ağırlığının etkisinin sadece elde alınan eldeki veya genel olarak örneklemede önemli görünüp görünmediği hakkında fazla bilgi göstermeyecektir (en azından doktorun uzmanlık düzeyinde değil) sunmak zorunda). Sadece bir sonuç hesaplar.

Daha iyi ne

Hangi yöntemi seçeceğiniz, soruna hangi açıdan bakacağınıza bağlıdır: Bir hasta olarak, doğrusallık gibi güçlü ve açıkça yanlış varsayımlar olmadan başıma ne olacağı konusunda en iyi tahminde bulunmak için mevcut tüm verileri kullanan sinir ağını tercih ederim. Bir dergide bazı verileri sunmak isteyen doktor olarak, p-değerlerine ihtiyacı var. Tıp çok muhafazakar: p-değerleri isteyecekler. Böylece doktor, böyle bir durumda cinsiyetin önemli bir etkiye sahip olduğunu bildirmek istiyor. Önemli olan hasta için, sadece numunenin en muhtemel olduğunu düşündüğü herhangi bir şeyi kullanın.

Bu örnekte, hasta öngörü ister, doktorun bilim adamı tarafı çıkarım ister. Çoğunlukla, bir sistemi anlamak istediğinizde, çıkarım iyidir. Sistemi anlayamayacağınız bir karar vermeniz gerekiyorsa, tahmin yeterli olacaktır.


1
“Bir hasta olarak, sinir ağını tercih ederdim…” Klinik bilimlerde büyük miktarda verinin elde edilmesinin çok zor olabileceği gerçeğini görmezden geliyor gibi görünüyorsunuz. Güvenlik, gizlilik ve etik kaygılar nedeniyle grup başına sadece birkaç gözlemin veri setleri nadir değildir. Veri oluşturma işleminde savunulabilir varsayımlar yapabilirseniz, verileri çok daha verimli kullanabilirsiniz.
Frans Rodenburg

Bunun, görünüşte aynı problemin neden çıkarım soruları ve tahmin problemleri doğurabildiği ve neden aynı olmadıkları ile kolayca ilgili olabileceği varsayımsal bir senaryo olması gerekiyordu. Hasta sağkalım şansını gerçekten tahmin etmek için yöntemler önermiyordum ve evet, fark edilebilir boyutta güvenilir klinik veriler elde etmenin ne kadar zor olabileceğinin farkındayım. IMHO'nun iyi varsayımlar / veri üreten sürecin bilgisi tahmin etmenin yanı sıra çıkarımda da yardımcı olacaktır, dolayısıyla her ikisini de ayırt etmede çok fazla bir şey olmaz.
Bernhard

1

Burada yalnız değilsin. Cevapları okuduktan sonra, artık kafam karıştı değil - farkı anladığım için değil, ama bunun bakanın gözünde olduğunu ve sözlü olarak uyarıldığını anladığım için. Eminim şimdi bu iki terim bilimsel terimlerden çok politik tanımlar. Örneğin, kolejlerin iyi bir araç olarak kullanmaya çalıştığı kitabın açıklamasını ele alalım: "nehir manzarasına sahip bir evin değeri ne kadar olacak? Bu bir çıkarım sorunudur." Benim açımdan, bu kesinlikle bir tahmin problemidir. Sivil inşaat şirketi sahibisiniz ve bir sonraki ev inşa etmek için en iyi alanı seçmek istiyorsunuz. Aynı şehirde, biri nehrin yanında, diğeri tren istasyonunun yanında olmak üzere iki konum arasında seçim yapmak zorundasınız. Tahmin etmek istiyorsuniki konum için de fiyatlar. Ya da çıkarım yapmak istersin . Tam istatistik yöntemlerini uygulayacaksınız, ancak işlemi adlandırıyorsunuz. :)


Nehir manzarasının belli bir fiyatı gerektireceği fikri nedensel bir yorumdur. Öngörü nedensellik hakkında çok agnostiktir: Nedenlerden, etkilerden nedenler veya benzer nedenlerden başka bir etkiden 1 etki tahmin edebilirim. 5'10 "olan ve hiç tanımadığım özdeş bir ikizim olan Bobby, arkadaşım Billy'yi düşünün. Yine de, Bobby'nin 5'10 olduğunu tahmin edebilirim", ancak Billy'ye asansör ayakkabılarını vererek uzun boylu yaparsam, Billy'in de aynı şekilde uzun boylu olacağını tahmin edemem.
gung - Reinstate Monica

Aldığın örnek basit bir örnek, bu yüzden kafa karıştırıcı. Çıkarım ve tahmin arasındaki farkın “politikadan” kesinlikle daha fazlası var.
Richard Hardy

1

Borçluların kredilerini geri ödeyip ödemeyeceklerine dair güçlü bir tahmincinin, zeminlerini mobilya ayakları tarafından çizilmekten korumak için keçe kullanıp kullanmadıklarını gösteren iyi bir araştırma var. Bu "keçe" değişkeni, sonucun temerrüde karşılık temerrüde olduğu öngörücü bir modele yönelik farklı bir yardımcı olacaktır. Bununla birlikte, borç verenler bu sonuçtan daha fazla kaldıraç elde etmek isterlerse, hissettiklerini olabildiğince geniş bir şekilde dağıtarak bunu yapabileceklerini düşünerek cevap alacaklardır.

“Bu borç alanın geri ödemesi ne kadar olası?” bir tahmin problemidir; "Sonuçları nasıl etkileyebilirim?" nedensel bir çıkarım problemidir.


-1

y = f (x) sonra

Tahmini (verilen x değeri ile Y'nin değeri nedir: eğer x'in spesifik değeri ise, Y'nin değeri ne olabilir?

çıkarım (y, x'teki değişiklikle nasıl değişir): x değişirse Y üzerindeki etkisi ne olabilir

Tahmin örneği: y bir kimsenin maaşını temsil ederse, o zaman yılların tecrübesi, girdi değişkenleri gibi derece sağlarsak, fonksiyonumuz çalışanın maaşını tahmin eder.

Çıkarım örneği: yaşam masraflarının değiştiğini ve maaştaki değişimin ne kadar olduğunu varsayalım


Bu cevabın neden iki düşük oyla hak ettiğini anlamıyorum.
gung - Reinstate Monica
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.