Açıklayıcı ve öngörücü modelleme üzerine pratik düşünceler


70

Nisan ayında, UMD Matematik Bölümü İstatistikleri grup seminer serisinde "Açıklamak veya Tahmin Etmek" adlı bir konuşmaya katıldım. Konuşma, UMD'nin Smith Business School'da ders veren Prof. Galit Shmueli tarafından verildi . Konuşması, "IS Araştırmalarında Tahmine Dayalı ve Açıklayıcı Modelleme" başlıklı bir makale ve "Açıklamak veya Tahmin Etmek İçin" başlıklı bir çalışma çalışması için yaptığı araştırmaya dayanıyordu. .

Shmueli'nin argümanı, istatistiksel modelleme bağlamında yordayıcı ve açıklayıcı terimlerin birbirine karıştığı ve istatistik literatürünün farklılıkların tam bir tartışmasından yoksun olduğu yönündedir. Gazetede her ikisini de çelişiyor ve pratik sonuçları hakkında konuşuyor. Gazeteleri okumanı tavsiye ediyorum.

Uygulayıcı topluluğuna sormak istediğim sorular:

  • Açıklayıcı / açıklayıcı olana karşı öngörülü bir alıştırmayı nasıl tanımlarsınız? Belirli bir uygulama hakkında konuşabilmeniz faydalı olacaktır.
  • Hiç birini kullanmak için bir anlam kullanırken tuzağa düştün mü? Kesinlikle var. Hangisini kullanacağını nereden biliyorsun?

2
Bu sorunun kapatılması önerildi. Bakınız: meta.stats.stackexchange.com/questions/213/… 2 oy olduğunu görüyorum. Seçmenler veya OP, soruyu neden meta başlıkta açık görmek istediklerini açıklayabilir mi?

9
"Bu kapalı olmalı. Biri savunmalı" demekten ziyade, neden kapalı olmasını istediğinizi açıklamaya başlayabilirsiniz. Çok belirsiz? Ardından açıklama isteyin. Bu bana makul bir soru gibi görünüyor. Soru sahibi bir bildiri sunar ve tahmin edici ve açıklayıcı istatistikler arasındaki farkın olup olmadığını sorar. Soruda yapacağım tek değişiklik, soruyu tam olarak netleştirmek ve oy vermeyi kolaylaştırmak.
JD Long,

2
Meta konu hakkında zaten bir sebep önerdim. Soruyla ilgili 'meta tartışmaların' bu sayfayı karıştırdığını düşünüyorum.

2
@Srikant @JD Soruyu arttıracağım. Geri dönüşünüz için teşekkür ederiz. Bunun tartışmaya değer bir konu olduğunu düşünüyorum.
wahalulu,

4
Yukarıda belirtilen konuşmalara / bildirilere uygun bağlantılar ekleyebilir misiniz?
chl

Yanıtlar:


39

Bir cümlede

Tahmine dayalı modelleme tamamen "ne olması muhtemeldir?" İle ilgilidir, açıklayıcı modelleme ise "bu konuda ne yapabiliriz?"

Birçok cümle

Bence asıl fark, analizle yapılması amaçlanan şey. Açıklamanın, müdahale için öngörmekten daha önemli olduğunu söyleyebilirim . Bir sonucu değiştirmek için bir şeyler yapmak istiyorsanız, o zaman neden böyle olduğunu açıklamaya bakıyor olabilirsiniz. Açıklayıcı modelleme, iyi yapılırsa, size nasıl müdahale edileceğini (hangi girdilerin ayarlanması gerektiğini) söyleyecektir. Ancak, geleceğin nasıl olacağını anlamak istiyorsanız, müdahale etme niyeti (veya yeteneği olmadan) öngörücü modellemenin uygun olması daha muhtemeldir.

İnanılmaz derecede gevşek bir örnek olarak, "kanser verileri" kullanarak.

Eğer farklı hastanelerin kanser korumalarını finanse ediyor olsaydınız, “kanser verilerini” kullanarak öngörüsel modelleme uygun olurdu (veya en azından faydalıdır). İnsanların neden kanser olduğunu açıklamanıza gerek yok, bunun yerine ne kadar hizmet gerektiğinin kesin bir tahminine ihtiyacınız var. Açıklayıcı modelleme muhtemelen burada pek yardımcı olmaz. Örneğin, sigara içmenin yüksek kanser riskine yol açtığını bilmek kendi başına A koğuşuna veya B koğuşuna daha fazla fon sağlayıp sağlamadığınızı söylemez.

Ulusal kanser oranını azaltmak istiyorsanız, "kanser verilerinin" açıklayıcı modellemesi uygun olacaktır - prediktif modelleme burada oldukça eskidir. Kanser oranlarını doğru bir şekilde tahmin edebilme yeteneğinin, nasıl düşürüleceğine karar vermenize yardımcı olması pek mümkün değildir. Bununla birlikte, sigara içmenin daha yüksek kanser riskine yol açtığını bilmek değerli bilgilerdir - çünkü sigara içme oranlarını düşürürseniz (örneğin sigaraları daha pahalı hale getirerek), bu daha az riskli daha fazla insana yol açar, (umarım) kanserde beklenen bir azalmaya yol açar oranları.

Soruna bu şekilde bakıldığında, açıklayıcı modellemenin temel olarak doğrudan veya dolaylı olarak kullanıcının kontrolündeki değişkenlere odaklanacağını düşünüyorum. Diğer değişkenleri toplamaya ihtiyaç duyulabilir, ancak analizdeki değişkenlerin hiçbirini değiştiremezseniz, açıklayıcı modellemenin, size bu değişkenleri kontrol etme veya etkileme arzusu verme haricinde, faydalı olacağından şüpheleniyorum. hangisi önemlidir. Tahminli modelleme, kabaca, sadece kullanıcı tarafından kontrol edilip edilmediğine bakılmaksızın değişkenler arasındaki ilişkileri arar. Öngörü yapmak için sadece giriş / özellikler / bağımsız değişkenler / etc .. bilmeniz gerekir, ancak bir sonucu arayabilmek ve değiştirebilmek için giriş / özellikler / bağımsız değişkenler / vb. .


9
+1, güzel yapılır! Nitpick'ten nefret ediyorum ama notun geleceğe yönelik olması gerekmediğini belirtmek isterim. Örneğin, bir arkeolog, geçmişte kalan bir bölgedeki yağış seviyesini kalan izler (yani yağışın etkileri) bilgisi ile belirlemek isteyebilir.
gung

@gung - Bunun olmaması için cevabımı ifade ettiğimi düşündüm. Açıkçası, bir noktayı özledim :-)
Olasılık

Güzel cevap Bence pek çok durumda geleceğin neye benzediğini ve neden olduğunu bilmemiz gerekiyor. Diyelim ki, müşteri karmaşasını incelerken, gelecek ay boyunca kaç müşterinin (ve tam olarak hangi müşterinin) kaçınıldığını ve ardından neden onların budama yaptıklarını, böylece pazarlamanın onları tutmak için müdahale edebileceğini bilmek istediğinizi varsayalım. O zaman hem öngörücüye (gelecekteki sayıyı ve müşterileri öğrenmek için) hem de bize nedenini açıklamak için açıklayıcıya ihtiyacımız var, bu nedenle çalkalayıcıları azaltabiliriz. Peki, ikimizin de hibrit bir modeline sahip miyiz? Varty, "Bilinen ilişki açıklayıcı / açıklayıcı bir analizden veya başka bir teknikten ortaya çıkabilir" diyerek dokunuyor
Espanta

@gung ı aşk nitpick: arkeolog deneyimlerini tahmin etmek istediği onu gelecekte (o gelecekte bir noktada geçmiş yüksek yağış izlerini bulacaksınız yani tahmin).
Alexis,

@Alexis, bu kesinlikle mümkün, ama aynı zamanda arkeologların birincil araştırma ilgisi olmadığı ve bu verilerin başka araştırmacılar tarafından toplanmış olması (paleoclimatologists) ve arkeolog, bu verileri basitçe bu teorileri test etmek için kullanmak istiyor. birincil teorik ilgi alanları ( Gill, 200 ).
gung

30

Benim görüşüme göre farklılıklar aşağıdaki gibidir:

Açıklayıcı / Tanımlayıcı

Açıklayıcı / açıklayıcı bir cevap ararken, öncelikli odak, elimizdeki veriler üzerindedir ve gürültü hesaba katıldıktan sonra veriler arasındaki temel ilişkileri keşfetmeye çalışırız.

Örnek: Düzenli egzersiz yapmanın (günde 30 dakika) kan basıncının düşmesine neden olduğu doğru mudur? Bu soruyu cevaplamak için, hastalardan egzersiz rejimleri ve zaman içindeki kan basıncı değerleri hakkında veri toplayabiliriz. Amaç, kan basıncındaki değişiklikleri egzersiz rejimindeki değişikliklerle açıklayabiliyor muyuz .

Tansiyon sadece bir kişinin yediği sodyum miktarı gibi çok çeşitli diğer faktörlerin egzersizi ile etkilenmez. Bu örnekte odak, egzersiz rejimi ve kan basıncı.

tahmin

Prediktif bir egzersiz yaparken, elimizdeki veriler arasındaki bilinen ilişkileri kullanarak bilinmeyene fazladan bakıyoruz. Bilinen ilişki, açıklayıcı / açıklayıcı bir analizden veya başka bir teknikten kaynaklanabilir.

Örnek: Günde 1 saat egzersiz yaparsam, kan basıncımın düşme olasılığı ne kadardır? Bu soruyu cevaplamak için, tahminde bulunmak için kan basıncı ile egzersiz rejimi arasında daha önce ortaya çıkmamış bir ilişki kullanabiliriz.

Yukarıdaki bağlamda, odaklama açıklamada değildir, ancak açıklayıcı bir model tahmin sürecine yardımcı olabilir. Değişkenler arasındaki temel ilişkinin doğasına ilişkin bilgilerimize ilâve olarak gerekmedikçe bilinmeyeni tahmin etmekte iyi olan açıklayıcı olmayan yaklaşımlar (örneğin, sinir ağları) da vardır.


6
+1 Bu cevap açıklama, açıklama ve ilişki dilini kullanarak nedensellik ile ilişkilendirmeyi karıştırmaz. Bu, istenen bir netlik derecesine sahiptir.
whuber

4
Açıklamaya göre, "öncelikli odak, sahip olduğumuz verilere dayanıyor" - yazdığınızı düşünüyorum - görevin retrospektif olduğunu söylemeye çalıştığınızı düşünüyorum (tahminin muhtemel doğası yerine). Açıklamada ("nedensel açıklama" okuyun) aslında teori ve alan bilgisine büyük bir odak vardır ve veriler bu varsayımları / teorileri test etmek için kullanılmaktadır. Buna karşılık, öngörmede daha veri odaklı ve ilişkiler konusunda daha açık fikirlisiniz, çünkü nedensellik aramıyorsunuz, daha çok korelasyon arıyorsunuz.
Galit Shmueli

@GalitShmueli Reg teorisi / alan bilgisi - evet, bu noktaya katılıyorum. Basitçe, açıklamanın karşılığını tahmin etmeme karşı koymaya çalışıyordum; bu bana neyin göründüğüne odaklanarak değişkenler arasındaki ilişkiyi ortaya koyuyor ve değişkenler arasındaki ilişkiyi ortaya koyuyordu. Bu süreçte elbette iki paradigma arasındaki ince nüansları ihmal etmekten suçluyum.
varty

1
@varty Amacınızla aynı fikirdeyim: açıklama / açıklamada genel / ortalama bir ilişki / etki ile ilgileniyorsanız, tahmininde bireysel değerleri tahmin etmekle ilgileniyorsunuz (zorunlu olarak ekstrapolasyon değil)
Galit Shmueli

19

Burada ortaya çıkan pratik bir konu modellemede değişken seçimidir. Bir değişken önemli bir açıklayıcı değişken olabilir (örneğin, istatistiksel olarak anlamlıdır) ancak öngörücü amaçlar için yararlı olmayabilir (yani modele dahil edilmesi daha kötü tahminsel doğruluğa neden olur). Bu hatayı hemen hemen her gün yayınlanan yazılarda görüyorum.

Diğer bir fark, temel bileşenler analizi ile faktör analizi arasındaki farktır. PCA genellikle öngörmede kullanılır, ancak açıklama için çok kullanışlı değildir. FA, yorumlamayı (ve dolayısıyla açıklamayı) geliştirmek için yapılan ek dönme adımını içerir. Bir yoktur bu konuda Galit Shmueli blogunda güzel sonrası bugün .

Güncelleme: bir değişken önemli bir açıklayıcı değişken olabileceği zaman gelecek serilerde ortaya çıkar, ancak sadece gelecek için mevcut değildir. Örneğin, konut kredileri ile GSYİH arasında güçlü bir ilişki olabilir, ancak GSYİH ile ilgili iyi tahminler yapmadığımız sürece gelecekteki konut kredilerini öngörmek için pek bir faydası yoktur.


3
Önemli bir açıklayıcı değişken neden öngörülebilir doğruluğu neden düşürür?

3
@Srikant. Bu, açıklayıcı değişkenin, cevap değişkeni ile zayıf ama önemli bir ilişkisi olduğunda meydana gelebilir. O zaman katsayı istatistiksel olarak anlamlı olabilir ancak tahmin edilmesi zor olabilir. Sonuç olarak, değişkenlerin dahil edilmemesine kıyasla değişken dahil edildiğinde tahminlerin MSE'si artabilir. (Önyargı, dahil edilmesiyle azalır, ancak varyans artar.)
Rob Hyndman

İlk paragraf çok, çok iyi bir nokta. Hala bazen daha da kötüdür; burada PMID: 18052912, bazen setin gürültü kısmında gerçek bir modele göre daha iyi bir model yapılabileceğinin harika bir örneği - birinin rasgele veriler üzerinde iyi bir model yapabileceği açık, ama bu biraz şok edici. .

1
bağımlılığımı affet, ama rotasyon normalde PCA'nın yanı sıra FA'nin bir parçası değil mi?
richiemorrisroe 15:11

3
İstatistiksel olarak sig. ancak zayıf öngörücü, tahmin veya açıklama için nadiren etkilidir. Örneğin, bir doğrusal regresyon çözeltisi, X1 öngörücüsünü dahil etmeden, bir RSQ değeri 0,40 ise ve X1'in dahil edilmesi bu RSQ'ya 0,01 eklenirse, X1, tahmin ya da açıklama için "önemli" değildir.
rolando2

17

Her ne kadar bazı insanlar, kullanılan model / algoritma açısından farklılığı düşünmeyi en kolay bulsalar da (örneğin, sinir ağları = tahmine dayalı), bu açıklama / tahmin etme ayrımının yalnızca bir özelliğidir. İşte veri madenciliği kursumda her iki açıdan da doğrusal regresyon öğretmek için kullandığım bir slayt destesi . Yalnızca doğrusal regresyonda ve bu küçük örnekte bile, açıklayıcı ve öngörücü hedefler için farklı modellere yol açan çeşitli değişkenler ortaya çıkmaktadır (değişkenlerin seçimi, değişken seçimi, performans ölçüleri vb.)

Galit


5
Meraktan, tahmin için regresyon tartışmanızda (sayfa 33'e başlarken) eğitim ve onaylama veri setlerine (adım 3) ayrılmadan önce öngörücüleri seçmeniz (adım 1) kasıtlı mı? En objektif ve dürüst prosedürün, dağınık noktalara bakmadan önce bile, başlangıçta bölümlere ayrılacağını düşündüm (adım 2). Eğer regülatörler tüm veri setine dayanarak seçildiyse, bu daha sonra validasyon verilerine uygulandığında bile birçok testte belirgin önem seviyelerini şişirmez mi?
whuber

Bence daha genel soru, bekletmeden önce veri görselleştirmesi yapıp yapmamanızdır. Veri kümesi büyük olduğunda, o zaman gerçekten önemli değil. Küçük bir örneklemde, öngörücüleri seçmek için görselleştirmeyi kullanmak gerçekten tehlikelidir. Slaytlarımda değişken seçimi için görselleştirme kullanmak istemiyorum. "Seçim belirleyicileri" daha genel olarak "makul olan potansiyel bir tahmin belirleyici setini seç" dir. Makul bir küme seçmek için alan bilgisini birleştirmek hakkında daha fazla bilgi.
Galit Shmueli

"Açıklamak veya tahmin etmek" konusuna devam etmekle ilgili burada bir sorum var . Soru çoğunlukla kağıdınıza dayandığından, bir göz atarsanız sevinirim.
Richard Hardy

Profesör Shmueli, bu konuyla ilgili makalenizin 291. sayfasında, Geisser, 1993 tarafından tanımlandığı gibi sadece 'nontochastic tahmin' olduğunu düşündüğünüzü söylüyorsunuz. Ayrıca yeni bir yazı başlatmak için sevindim, ama önce burada soracağımı düşündüm.
user0

11

Örnek: Gördüğüm klasik bir örnek, insan performansını öngörme bağlamında. Kendi kendine yeterlilik (yani, bir insanın bir işi iyi yapabileceğini düşündüğü derece) çoğu zaman görev performansının güçlü bir göstergesidir. Böylece, kendi kendine yeterliliğini, zeka ve önceki deneyimin derecesi gibi diğer değişkenlerle birlikte çoklu bir regresyona sokarsanız, genellikle öz yeterliliğin güçlü bir tahmin edici olduğunu görürsünüz.

Bu, bazı araştırmacıların öz yeterliliğin görev performansına neden olduğunu önermesini sağlamıştır. Ve bu etkili müdahaleler, bir kişinin kendi kendine yeterlilik hissini arttırmaya odaklananlar.

Bununla birlikte, alternatif teorik model öz yeterliği, büyük ölçüde görev performansının bir sonucu olarak görmektedir. Yani, eğer iyiyseniz, bileceksiniz. Bu çerçevede müdahaleler, gerçek yeterliliği arttırmaya ve algılanan yeterliliği artırmaya odaklanmalıdır.

Bu nedenle, kendi kendine yeterlilik gibi bir değişken dahil etmek, öngörüyü artırabilir, ancak sonuç olarak kendi kendine yeterlilik modelini benimsediğinizi varsayarsak, modelin amacı, performansı etkileyen nedensel süreçleri aydınlatmaksa, bir öngörücü olarak dahil edilmemelidir.

Bu, nedensel bir teorik modelin nasıl geliştirileceği ve geçerli kılınacağı sorununu gündeme getirmektedir. Bu açıkça, ideal olarak bazı deneysel manipülasyonlarla ve dinamik süreçlerle ilgili tutarlı bir argümanla çoklu çalışmalara dayanır.

Proksimal-distal'e karşı : Araştırmacılar distal ve proksimal nedenlerin etkileriyle ilgilendiğinde benzer sorunları gördüm. Proksimal nedenler, distal nedenlerden daha iyi tahmin etme eğilimindedir. Bununla birlikte, teorik ilgi distal ve proksimal nedenlerin nasıl işlediğini anlamakta olabilir.

Değişken seçim sorunu : Son olarak, sosyal bilim araştırmalarında büyük bir sorun değişken seçim meselesidir. Herhangi bir çalışmada, ölçülebilen ancak ölçülmeyen sonsuz sayıda değişken vardır. Bu nedenle, modellerin yorumlanması teorik yorumlar yaparken bunun sonuçlarını dikkate almalıdır.


Sosyal bilimlerde "zayıf hipotez" in de bir sorunu var (örneğin, etki olumlu veya olumsuzdur). Ve bu "öz yeterlik" örneğinde, bunu her bir insanın oluşturduğu bir iç performans belirleyicisi olarak görebilirdiniz. Bu yüzden muhtemelen açıklayıcı bir değişken olarak "kara kutu" tahminini kullanmaya benzer.
probabilityislogic

9

İstatistiksel Modelleme: İki Kültür (2001), L. Breiman tarafından, belki de bu noktadaki en iyi makaledir. Başlıca sonuçları (ayrıca belgenin sonundaki diğer önemli istatistikçilerin cevaplarına bakınız) aşağıdaki gibidir:

  • "Daha yüksek tahmin doğruluğu, temel alınan veri mekanizması hakkında daha güvenilir bilgilerle ilişkilendirilir. Zayıf tahmin doğruluğu sorgulanabilir sonuçlara yol açabilir."
  • "Algoritmik modeller, veri modellerinden daha iyi tahminsel doğruluk sağlayabilir ve temel mekanizma hakkında daha iyi bilgi sağlayabilir."

3
Sadece daha önceki bir soruyla bağlantı kurmak için: İki Kültür: istatistik vs. makine öğrenmesi?
chl

3
Algoritmik modellerde sorun, anlamak zor olmalarıdır. Bu, ortaya çıkan olası sorunları teşhis etmeyi ve gidermeyi zorlaştırır. Her bir bileşenin neye benzemesi gerektiğini bildiğiniz için yapısal bir modelin değerlendirilmesi çok daha kolaydır.
Olasılık 20

8

Bağlantılı makalenin özeti dışında çalışmalarını okumamıştım, ama benim düşünceme göre "açıklama" ile "tahmin" arasındaki ayrım atılmalı ve pratisyen hekimin amaçları arasındaki ayrımla değiştirilmelidir. nedensel "veya" öngörücü ". Genel olarak, "açıklama" nın neredeyse hiçbir şey ifade etmeyen belirsiz bir kelime olduğunu düşünüyorum. Örneğin, Hooke Yasası açıklayıcı mı yoksa öngörücü mü? Spektrumun diğer ucunda, tahmin edici olarak doğru öneri sistemleri açık madde derecelendirmelerinin iyi nedensel modelleri midir? Sanırım hepimiz bilimin amacının açıklama olduğu fikrini paylaşırken, teknolojinin hedefi ise tahmindir; ve bu sezgi bir şekilde, denetlenen öğrenme algoritmaları gibi, kullandığımız araçları göz önüne alarak kaybolur,

Bunları söyledikten sonra, belki bir modele uygulayacağım tek kelime yorumlanabilir. Regresyonlar genellikle yorumlanabilirdir; birçok katmanı olan sinir ağları genellikle öyle değildir. Bence insanlar bazen saf olarak yorumlanabilir bir modelin nedensel bilgi sağladığını, yorumlanamayan modellerin ise sadece öngörüsel bilgi sağladığını varsayıyor. Bu tutum benim için kafam karıştı.


7

Ben hala sorunun ne olduğu konusunda net değilim. Bunu söylerken aklıma göre öngörücü ve açıklayıcı modeller arasındaki temel fark odaklarındaki farktır.

Açıklayıcı Modeller

Açıklayıcı modeller tanım gereği asıl odak noktası olarak gerçek dünyada bir şeyi açıklama amacına sahiptir. Çoğu durumda, basit ve temiz açıklamalar sunmaya çalışıyoruz. Basit derken biz parsimoni (olduğunca az parametrelerle mümkün olan olayları açıklamak) tercih ve temiz tarafından ben aşağıdaki biçimde açıklama yapmak istiyorum anlamına anlamına: "değiştirme etkisini bir birim değişikliği tarafından her şeyi sabit tutmak ". Açıklayıcı modeller, bu basit ve açık açıklamaların hedefleri göz önüne alındığında, karmaşık modelleri cezalandırmayı (AIC gibi uygun kriterleri kullanarak) ve ortogonal bağımsız değişkenleri (kontrollü deneyler veya uygun veri dönüşümleri yoluyla) elde etmeyi tercih eder.y βxyβ

Tahmini Modeller

Tahmini modellerin amacı bir şeyleri tahmin etmektir. Böylece, daha az para cezasına veya sadeliğe odaklanma eğilimindedir, fakat daha çok bağımlı değişkeni öngörme yeteneklerine odaklanırlar.

Bununla birlikte, yukarıda açıklayıcı modeller öngörü için kullanılabildiğinden ve bazen öngörücü modeller bir şeyi açıklayabildiğinden, yukarıdaki yapay bir ayrımdır.


En tepedeki cevaplar tarafından doğrudan belirtilmeyen karmaşıklıktan bahsetmek için +1 . Ancak, meydan okuma açıklayıcı modeller müdahaleler için kullanıldığında ortaya çıkmaktadır. Bir kişi, tahmin edilen katsayıların, parlamentodan kaynaklanan yaygın bir sorun olan önyargılı olmamasını nasıl sağlar?
Thomas Speidel

5

Diğerlerinin daha önce de söylediği gibi, araştırmacının amaçlarıyla ilgili olduğu sürece, ayrım biraz anlamsızdır.

İki Kültür kitabının yorumcularından Brad Efron, şu gözlemi yaptı: ( daha önceki sorumla tartışıldığı gibi ):

Tahmin kendi başına ancak ara sıra yeterlidir. Postane, elle yazılmış notlardan doğru adresleri öngören herhangi bir yöntemden memnun. Peter Gregory, tahminde bulunma amacına yönelik çalışmayı üstlendi, aynı zamanda hepatitin tıbbi temelini daha iyi anlayabilmek için çalışmalarını yürüttü. Birçok istatistiksel anket nedensel faktörleri nihai hedefleri olarak tanımlamaktadır.

Bazı alanlar (örneğin, Tıp), açıklayıcı süreç (dağıtım vb.) Olarak kullanılan, veriyi oluşturan temel süreci anlamak için kullanılan modele ağır bir ağırlık verir. Diğer alanlar bundan daha az endişe duyuyor ve öngörücü başarıları çok yüksek olan "kara kutu" modeliyle mutlu olacaklar. Bu, model oluşturma sürecine de girebilir.


5

Saygılarımla, bu soru daha iyi odaklanmış olabilir. İnsanlar daha uygun olduğunda bir terimi hiç kullandılar mı? Evet tabi ki. Bazen bağlamdan yeterince açıktır veya sinsi olmak istemezsiniz. Bazen insanlar terminolojisinde özensiz ya da tembeldirler. Bu birçok insan için geçerlidir ve kesinlikle daha iyi değilim.

Buradaki potansiyel değeri (CV ile ilgili açıklama ve tahmin tartışırken), iki yaklaşım arasındaki ayrımı açıklığa kavuşturmaktır. Kısacası, ayrım nedensellik rolü üzerinde durmaktadır.. Dünyadaki bazı dinamikleri anlamak ve neden böyle bir şeyin olduğunu açıklamak istiyorsanız, ilgili değişkenler arasındaki nedensel ilişkileri tanımlamanız gerekir. Tahmin etmek için nedenselliği görmezden gelebilirsiniz. Örneğin, nedeni hakkındaki bilgiden bir etki tahmin edebilirsiniz; nedenin varlığını, etkinin gerçekleştiğinden haberdar olabilirsiniz; ve aynı nedenden kaynaklanan başka bir efektin bilgisiyle bir etkinin yaklaşık seviyesini tahmin edebilirsiniz. Neden biri bunu yapabilmek istesin ki? Gelecekte neler olabileceği konusundaki bilgilerini artırmak, buna göre plan yapabilmeleri için. Örneğin, bir tahliye kurulu tahliye edildiğinde hükümlünün tekrar yasaklama olasılığını tahmin etmek isteyebilir. Ancak, açıklama için bu yeterli değildir. Tabii ki, İki değişken arasındaki gerçek nedensel ilişkinin tahmin edilmesi son derece zor olabilir. Ek olarak, gerçek nedensel ilişkileri yakalayan (olduğu düşünülen) modeller, öngörülerde bulunmak için genellikle daha kötüdür. Peki neden öyleyse? Birincisi, bunun çoğu, kendi iyiliği için anlayışın sürdürüldüğü bilimde yapılır. İkincisi, gerçek nedenleri güvenilir bir şekilde saptayabilirsek ve onları etkileme becerisini geliştirebilirsek, etkiler üzerinde bir miktar etki yapabiliriz.

İstatistiksel modelleme stratejisi ile ilgili olarak, büyük bir fark yoktur. Öncelikle fark, çalışmanın nasıl yapıldığına bağlıdır. Amacınız tahmin edebilmek ise, modelin kullanıcıları tahminde bulunmaları gerektiğinde kullanabilecekleri bilgileri bulun. Erişemeyecekleri bilgiler hiçbir değere sahip değildir. Büyük olasılıkla, yordayıcıların belirli bir düzeyinde (veya dar bir aralıkta) tahmin edebilmek isteyeceklerse, yordayıcının örneklenen aralığını o düzeye ortalamaya çalışın ve orada örnek alın. Örneğin bir şartlı tahliye kurulu çoğunlukla 2 büyük mahkumiyet içeren suçlular hakkında bilgi edinmek isterse, 1, 2 ve 3 mahkumiyet içeren suçlular hakkında bilgi toplayabilirsiniz. Öte yandan, bir değişkenin nedensel durumunu değerlendirmek temel olarak bir deney gerektirir. Yani, Deneysel birimlerin, açıklayıcı değişkenlerin önceden belirlenmiş seviyelerine rastgele atanması gerekir. Nedensel etkinin doğasının başka bir değişkene bağlı olup olmadığı konusunda endişeler varsa, bu değişken deneye dahil edilmelidir. Gerçek bir deney yapmak mümkün değilse, o zaman buraya giremeyecek kadar karmaşık olan çok daha zor bir durumla karşı karşıya kalırsınız.


1
Nedensellik rolünü merak ediyorum. Örneğin, bir blok kümesinin boyutlarının ve hacimlerinin bir veri kümesine sahip olduğumuzu ve onların ( etkileşimlerini ile gerileterek ilişkilerini modellediğimizi varsayalım. ). Hangi anlamda iki boyut ve bir cildin üçüncü boyuta "yol açtığı" söylenebilir? Dolayısıyla açıklama ve öngörü arasındaki fark, temelde farklı bir şeye dayanıyor gibi görünmektedir; yani analizin amacı . Son paragrafınıza göre, bu sitede stratejideki keskin farklılıkları kanıtlayan birçok hesap var. z ( x , y , v )(x,y,z,v)z(x,y,v)
whuber

1
Haklısın, bu çalışmanın amacına bağlı. Sanırım bu açıklığı yapmadım (sadece ne elde etmek istediğin hakkında konuştum ). Ayrıca, açıklamanın nedensellik ile tam olarak ilgilenmesi gerekmediği de doğrudur - nedenselliğe benzer bir şey de (örneğin, boyutlar - hacim durumu mantıklı / matematiksel imalardan biridir). Ancak, çoğu açıklayıcı modelleme nedensellik; Sanırım sadelik uğruna böyle bir şeyi atlayabileceğimi düşündüm. Son olarak, strateji çalışma tasarımı ve veri toplama sırasında farklılık gösterir, ancak y'ye x'e gerilemek hemen hemen aynıdır.
gung

Cevabınız için teşekkürler. Bu sitedeki diğer borsalardan, kelimenin tam anlamıyla doğru olmak yerine, yazarın geçmişini ve deneyimini yansıtmak için "nedensellik konusundaki en açıklayıcı modelleme merkezleri" gibi evrensel ifadeleri anlamayı öğrendim. Fiziksel ve "zor" bilimlerde bu ifade doğru olabilir, ancak sosyal ve "yumuşak" bilimlerde uygulayıcıların bu kadar güçlü bir iddiada bulunacağından şüpheliyim. Çoğu zaman, aslında, incelenen ilişkilerin ortak gizli nedenleri olduğuna inanılmaktadır ancak regresörler ile regresand arasındaki doğrudan nedenselliği yansıtmadığı düşünülmektedir.
whuber

@whuber Fikirlerimin geçmişim ve deneyimimden etkilendiği kesinlikle doğru. Bu cevap işe yaramazsa (oy kullanmadıgını farkettim), silebilirim. Başkaları da iletmek istediğim fikirleri kapsayan cevaplar verdi.
gung

@whuber - yumuşak nedenselliğe iyi bir örnek "sigara içmek kansere neden olur" - kanser olmadığına emin olduğumdan eminim. Nedensellik kavramı olayların zamanlaması ile bağlantılıdır. Sebep sonuçtan önce gerçekleşmelidir - bu, küp örneğinin neden bir anlam ifade etmediğini açıklar.
Olasılık 1

4

Cevapların çoğu, açıklama için modellemenin ve tahmin için modellemenin ne olduğunu ve neden farklı olduklarını netleştirmeye yardımcı oldu. Açık olmayan, şu ana kadar, nasıl farklı oldukları. Bu yüzden faydalı olabilecek bir örnek önerebileceğimi düşündüm.

Akademik not ortalamasının bir fakültesi olarak, not ortalaması olarak modellendiğimizi varsayalım. Akademik hazırlık önlemleri olarak, biz var:

  1. Yetenek Testi Puanları;
  2. HS GPA; ve
  3. Geçtiğimiz AP Testlerinin sayısı.

Tahmin Stratejisi

Amaç öngörü ise, tüm bu değişkenleri aynı anda doğrusal bir modelde kullanabilirim ve öncelikli kaygım öngörücü doğruluk olur. Değişkenlerden hangisi College GPA'yı tahmin etmek için en faydalı olduğunu ispatladıysa, son modele dahil edildi.

Açıklama Stratejisi

Eğer amaç açıklama ise, veri azaltma konusunda daha fazla endişelenebilir ve bağımsız değişkenler arasındaki korelasyonları dikkatlice düşünebilirim. Asıl endişem katsayıları yorumlamak olacaktı.

Örnek

İlişkili tahmincilere sahip tipik bir çok değişkenli problemde, "beklenmeyen" olan regresyon katsayılarını gözlemlemek nadir değildir. Bağımsız değişkenler arasındaki ilişkiler göz önüne alındığında, bu değişkenlerin bazıları için sıfır sıralı ilişkileriyle aynı yönde olmayan ve karşı sezgisel ve açıklanması zor görünebilecek kısmi katsayıların görülmesi şaşırtıcı olmaz.

Örneğin, modelin (Yetenek Sınavı Puanları ve Başarıyla dikkate alındığında Tamamlanan AP Testleri Sayısı ile) daha yüksek Lise Genel Müdürlük notlarının daha düşük Üniversite Genel Not ortalaması ile ilişkili olduğunu öne sürdüğünü varsayalım . Bu tahmin için bir sorun değildir, ancak böyle bir ilişkinin yorumlanmasının zor olduğu açıklayıcı bir model için sorun teşkil etmektedir . Bu model, örnek tahminlerin dışında en iyisini sağlayabilir, ancak akademik hazırlık ve Üniversite Genel Not ortalaması arasındaki ilişkiyi anlamamıza yardımcı olacak çok az şey var.

Bunun yerine, açıklayıcı bir strateji, temel bileşenler, faktör analizi veya SEM gibi bazı değişken azaltma biçimlerini isteyebilir:

  1. “akademik performansın” en iyi ölçüsü olan değişkene odaklanın ve bu değişkene College GPA modeli; veya
  2. Orijinal değişkenlerden ziyade üç akademik hazırlık ölçüsünün birleşiminden elde edilen faktör puanlarını / gizli değişkenleri kullanın.

Bunlar gibi stratejiler, modelin öngörücü gücünü azaltabilir, ancak Akademik Hazırlık'ın Üniversite GPA'sı ile nasıl ilişkili olduğunu daha iyi anlayabilirler.


Karşı sezgisel işaret ile ilgili olarak, sezgilerimizin yanlış değişkenleri yorumladığından, yani iç içe geçmiş veya etkileşimli etki gibi ana bir etki gibi mi olduğunu merak ediyorum.
Olasılık 1

3

Bu konuda model merkezli bir görüş sunmak istiyorum.

Tahmine dayalı modelleme çoğu analizde gerçekleşen şeydir. Örneğin, bir araştırmacı bir sürü yordayıcı içeren bir regresyon modeli kurar. Regresyon katsayıları daha sonra gruplar arasındaki prediktif karşılaştırmaları temsil eder. Tahmini boy, olasılık modelinden gelir: çıkarım, gözlemlenen popülasyonu veya numuneyi üretmiş olabilecek bir süper-popülasyon modeliyle ilgili olarak yapılır. Bu modelin amacı, bu süper nüfustan çıkan birimler için yeni çıktıları tahmin etmektir. Genellikle, bu boş bir amaçtır, çünkü özellikle sosyal dünyada her zaman işler değişiyor. Veya modeliniz ülkeler gibi nadir görülen birimler olduğundan ve yeni bir örnek alamıyorsanız. Modelin bu durumda kullanışlılığı, analistin takdirine bırakılmıştır.

Sonuçları diğer gruplara veya gelecekteki birimlere genelleştirmeye çalıştığınızda, bu yine de bir tahmindir ancak farklı bir türdür. Örneğin tahmin olarak adlandırılabilir. Kilit nokta, tahmin edilen modellerin yordayıcı gücünün varsayılan olarak açıklayıcı nitelikte olmasıdır. Sonuçları gruplar arasında karşılaştırırsınız ve bu karşılaştırmalar için bir olasılık modeli varsayılır, ancak bu karşılaştırmaların nedensel etkiler oluşturduğu sonucuna varamazsınız.

Sebep, bu grupların seçim önyargısından muzdarip olmalarıdır . Yani, tedaviye bakılmaksızın (varsayımsal nedensel müdahale), ilginin sonucu olarak doğal olarak daha yüksek bir puana sahip olabilirler. Veya diğer gruplardan farklı bir tedavi etki büyüklüğüne tabi olabilirler. Bu nedenle, özellikle gözlemsel veriler için, tahmin edilen modellerin genel olarak öngörücü karşılaştırmalar ile ilgili olduğu ve açıklama yapmadığıdır. Açıklama nedensel etkinin tanımlanması ve tahmini ile ilgilidir ve iyi tasarlanmış deneyler veya araçsal değişkenlerin düşünceli kullanımını gerektirir. Bu durumda, öngörüsel karşılaştırmalar seçim önyargısından kesilir ve nedensel etkileri temsil eder. Bu nedenle model açıklayıcı olarak kabul edilebilir.

Bu terimlerle düşünmenin, bazı veriler için bir model oluştururken gerçekte ne yaptığımı netleştirdiğini buldum.


+1, burada iyi bilgi var. Bununla birlikte, “Tahmine dayalı modelleme çoğu analizde gerçekleşen şeydir” ifadesi konusunda temkinli olurdum. Tahmini modellemenin daha yaygın olup olmadığı disipline göre farklılık gösterebilir. Vb. Akademideki çoğu modellemenin açıklayıcı olduğunu ve özel sektörde yapılan birçok modelleme / veri madenciliğinin (ör. Potansiyel müşterileri tanımlamak) olacağını tahmin ediyorum. Tahmini Kolayca yanlış olabilirdim, ama çoğu zaman olan bir priori olduğunu söylemek zor olacak.
gung

1
Eh, benim görüşüme göre, amaç açıklayıcı olsa bile, gözlemsel verilerin çoğu modellemesi yordayıcıdır. Eğer tedavinin niteliğini randomize etmezseniz ve deneysel bir kurulumda gerçekten bir değişikliğe neden olursanız, regresyon katsayılarınız sadece tanımlayıcı bir değere sahip olacaktır, yani, yalnızca öngörüsel karşılaştırmalar için araçlar sağlar. Örneğin, okulda demografik özelliklere dayanarak başarıyı tahmin edebilirsiniz ancak bu demografiklerin açıklayıcı nedensel etkiler olduğu anlamına gelmez. Bunun nedeni, karşılaştırmalı tahminlerin seçim yanlılığına maruz kalmasıdır.
Lionel Henry

1

Kara kutu "tahmine dayalı" modellerinden düşündüğümüzden çok daha fazlasını öğrenebiliriz. Anahtar, OUTPUT modelinin INPUT alanındaki değişikliklerden nasıl etkilendiğini gerçekten anlamak için farklı tipte duyarlılık analizleri ve simülasyonları yapmaktır. Bu anlamda, tamamen öngörülü bir model bile açıklayıcı görüşler sağlayabilir. Bu, araştırma topluluğu tarafından sıklıkla göz ardı edilen veya yanlış anlaşılan bir noktadır. Sadece bir algoritmanın neden çalıştığını anlamadığımız için, algoritmanın açıklayıcı güçten yoksun olduğu anlamına gelmez ...

Genel olarak ana bakış açısına göre, olasılıkbilimin özlü cevabı kesinlikle doğrudur ...


Eğer bu ifade ile nedenselliğe işaret ediyorsanız, “açıklayıcı içgörüler” in bu şekilde toplanabileceği açık değildir.
gung

1

İstatistikide açıklayıcı ve öngörücü uygulamalar dediği şey arasında ayrım var . Tam olarak kullanılmakta olan birini veya diğerini her kullanmamız gerektiğini bilmemiz gerektiğini söylüyor. Onları sık sık karıştırdığımızı, dolayısıyla uyuşmazlığı söyledi .

Sosyal bilimler uygulamalarında, ayrımın anlamlı olduğunu kabul ediyorum , ancak doğa bilimlerinde bunların aynı olması ve olması gerektiğine katılıyorum . Ayrıca, onlara çıkarım ve öngörme derim ve sosyal bilimlerde bunlardan birisinin karışmaması gerektiğine katılıyorum .

Doğa bilimleriyle başlayacağım. Açıklamaya odaklandığımız fizikte, dünyanın nasıl çalıştığını, neye neden olduğunu vb. Anlamaya çalışıyoruz. Bu yüzden odak nedensellik, çıkarım vb. Öte yandan, öngörücü özellik de bilimsel sürecin bir parçasıdır. Aslında, gözlemleri zaten iyi açıklayan (örnek içinde düşünün) bir teoriyi kanıtlama şekliniz , yeni gözlemleri önceden tahmin etmek ve tahminin nasıl işlediğini kontrol etmektir. Prediktif yeteneklerden yoksun olan herhangi bir teori, fizikte kabul görmekte büyük zorluk çekecektir. Bu yüzden Michelson-Morley gibi deneyler çok önemlidir.

Sosyal bilimlerde, ne yazık ki, altta yatan fenomen dengesiz, tekrar edilemez, yeniden üretilemez. Çekirdeğin çürümesini izlerseniz, onları her gözlemleyişinizde aynı sonuçları alır ve yüz yıl önce ben veya bir dostumla aynı sonuçları alırsınız. Ekonomi veya finansta değil. Ayrıca, deney yapma kabiliyeti çok sınırlıdır, tüm pratik amaçlar için neredeyse yoktur, sadece rastgele örnekler gözlemler ve yaparızgözlemlerin. Devam edebilirim ama fikir şu ki ele aldığımız fenomenlerin çok dengesiz olduğu, dolayısıyla teorilerimizin fizikle aynı kalitede olmadığı. Bu nedenle, durumla başa çıkmamızın yollarından biri ya çıkarım (neyin nedenini ya da neyin etkilediğini anlamaya çalıştığınızda) ya da tahminde bulunmak (sadece buna ne olacağını düşündüğünüzü ya da yapıyı görmezden geldiğini söylemek).


0

Yapısal bir model açıklamada bulunacaktır ve öngörücü bir model tahminde bulunacaktır. Bir yapısal model gizli değişkenlere sahip olacaktır. Yapısal bir model, eşzamanlı bir regresyon ve faktör analizi sonucudur.

Gizli değişkenler, öngörücü modellerde (regresyon) çoklu kolinite şeklinde ortaya çıkar.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.