Bir model verilere uyuyor mu veya veriler bir modele uyuyor mu?


20

Bir modeli verilere uydurmak ve verileri modele uydurmak arasında kavramsal veya prosedürel bir fark var mı? İlk ifadeler bir örneği görülebilir https://courses.washington.edu/matlab1/ModelFitting.html , ve ikinci https://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.html .


7
+1 İkinci bağlantıdan etkilenmedim ama eğlendim.
Laconic

Birçok model mevcut verilere uyar, ancak veriler genellikle en iyi bir modele uyar
Agnius Vasiliauskas

Yanıtlar:


35

Bağlantı kurduğunuz Wolfram kaynağı hariç , etkileşim kurduğum hemen hemen her kaynak veya kişi , sürece verilere bir model sığdırmak anlamına gelir . Model dinamik nesne ve veriler statik (sabit ve sabit) olduğu için bu mantıklıdır.

Bir noktaya değinmek gerekirse, Larry Wasserman'ın buna yaklaşımını seviyorum. Anlatımında istatistiksel bir model dağılımların bir toplamıdır. Örneğin, tüm normal dağılımların toplanması:

{Normal(μ,σ):μ,σR,σ>0}

veya tüm Poisson dağılımları kümesini:

{Poisson(λ):λR,λ>0}

Verilere bir dağıtım yerleştirmek , bir istatistiksel modeli bir veri kümesiyle birleştiren herhangi bir algoritmadır (veriler sabittir) ve modeldeki dağılımlardan tam olarak birini "en iyi" verileri yansıtan olarak seçer.

Model, değişen (bir çeşit) şeydir: onu tüm olasılık koleksiyonundan tek bir en iyi seçeneğe daraltıyoruz. Veriler sadece veridir; hiçbir şey olmuyor.


16

Rasch modelleme alanında verilerin modele uyumu yaygındır. Modelin doğru olduğu varsayılır ve ona uygun verileri bulmak analistin işi. Wikipedia makalesi Rasch üzerinde how ve nedeni hakkında daha ayrıntılı içeriyor.

Ancak diğerlerine katılıyorum, genel olarak istatistiklerde modeli verilere uyduğumuz için modeli değiştirebiliriz, ancak verileri seçmek veya değiştirmek kötü bir form olarak hissedilir.


7

Tipik olarak, gözlemlenen veriler model değişebilirken sabitlenir (örn. Parametreler tahmin edildiğinden), bu nedenle verilere uyacak şekilde yapılmış , başka bir şekilde değil modeldir . (Genellikle insanlar bu ifadeyi her iki ifadeden birini söylediklerinde ifade ederler.)

İnsanlar bir modele veri sığdırdıklarını söylediklerinde kendimi verilere ne yaptığını anlamaya çalışıyorum ? .

[Şimdi verileri dönüştürüyorsanız , bu muhtemelen 'bir modele veri sığdırmak' olacaktır, ancak insanlar neredeyse bu durumda bunu asla söylemezler.]


5
Aykırı değerlerin kaldırılması (tartışmalı olarak) "bir modele veri uydurma" da olacaktır.
Federico Poloni

1
İfadeyi "uygun (modele veri)" olarak düşünüyorlarsa anlamlı olabilir. Yani, bir takma işlemi yapıyorsunuz ve bu takma işlemi verilerden başlayıp bir modele dönüştürüyor. Bunun "(X'e uygun) Y'ye ayrışmasına karşı daha az yaygın / doğru bir yorum olduğuna katılıyorum, ama birisinin neden mantıklı bir şekilde söyleyebileceğine dair bir gerekçe olarak ortaya koydum.
RM

1
@FedericoPoloni Aykırı değerler genellikle daha sonra kullanmak istediğiniz modelden bağımsız olarak tanımlanır. Bu yüzden veriye uygun diyebilirsek bile, bu bir model değil, başka bir şey için olurdu.
BartoszKP

1
+1. Buna "veri" denmesinin bir nedeni var - verilen budur , kelimenin Latince kökenine bakın: latindictionary.wikidot.com/verb:dare
Christoph Hanck

2

Genellikle, verilerimizin "gerçek dünyaya" karşılık geldiğini ve herhangi bir değişiklik yapmanın "gerçek dünyayı" modellemekten uzaklaştığımız anlamına gelir. Örneğin, hesaplamayı daha güzel hale getirse bile, aykırı değerler hala verilerimizin bir parçası olduğu için aykırı değerlerin çıkarılmasına dikkat etmek gerekir.

Önyükleme veya diğer yeniden örnekleme tekniklerini kullanarak bir modeli test ederken veya bir tahmincinin özelliklerini tahmin ederken, tahmini bir model ve orijinal verilerimizi kullanarak yeni verileri simüle edebiliriz . Bu, modelin doğru olduğunu varsayar ve orijinal verilerimizi değiştirmiyoruz.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.