Yanıtlar:
Bence anlamı en iyi iki bölüme bakarak analiz edilir:
“Tüm modeller yanlış”, yani her model yanlıştır çünkü gerçekliğin basitleştirilmesidir. Bazı modeller, özellikle "zor" bilimlerde, sadece biraz yanlış. Sürtünme ya da küçük cisimlerin yerçekimi etkisi gibi şeyleri görmezden gelirler. Diğer modeller çok yanlış - daha büyük şeyleri görmezden geliyorlar. Sosyal bilimlerde, çok fazla görmezden geliyoruz.
"Ancak bazıları yararlıdır" - gerçekliğin basitleştirilmesi oldukça yararlı olabilir. Evreni ve tüm çeşitli bileşenlerini açıklamamıza, tahmin etmemize ve anlamamıza yardımcı olabilirler.
Bu sadece istatistikte doğru değil! Haritalar bir tür modeldir; Onlar yanlış. Fakat iyi haritalar çok faydalıdır. Diğer yararlı ama yanlış modellere örnekler boldur.
Bu, modelledikleri fenomenlerin kusursuz bir temsili olmayan modellerden faydalı bilgiler sağlanabileceği anlamına gelir.
İstatistiksel bir model matematiksel kavramları kullanan bir sistemin tanımıdır. Bu nedenle çoğu durumda, çıkarımsal prosedürünüzü kolaylaştırmak için belirli bir soyutlama katmanı eklersiniz (örn. Ölçüm hatalarının normalliği, korelasyon yapılarında bileşik simetri vb.). Öyle neredeyse imkansız tek bir model mükemmel gerçek bir dünya fenomeni kendimizi dünyanın öznel bir görünüme sahip verilmiş tarif etmek için (bizim duyu sistemi mükemmel değildir); Bununla birlikte, dünyamızın sömürdüğümüz belirli bir tutarlılık derecesine sahip olması nedeniyle başarılı istatistiksel çıkarım gerçekleşir. Yani bizim neredeyse her zaman yanlış modeller kanıtlarım faydalıdır .
(Yakında büyük bir cevap alacaksınız eminim ama bu konuda özlü olmaya çalıştım!)
An approximate answer to the right problem is worth a good deal more than an exact answer to an approximate problem.
Bu 2009 JSA konuşmasını Thad Tarpey tarafından Kutu geçişi hakkında yararlı bir açıklama ve yorum sağlamak için buldum. Modelleri gerçeğe yakın yaklaşımlar olarak görürsek, tüm modelleri doğru şekilde arayabildiğimizi savunuyor.
İşte soyut:
İstatistik öğrencileri, George Box'ın ünlü alıntılarına sık sık tanıtılıyor: “tüm modeller yanlış, bazıları faydalı.” Bu konuşmada, bu teklifin yararlı olsa da yanlış olduğunu savunuyorum. Farklı ve daha olumlu bir bakış açısı, bir modelin yalnızca ilgiden bilgi verilerini çıkarmanın bir aracı olduğunu kabul etmektir. Gerçek sonsuz karmaşıktır ve bir model sadece gerçeğe bir yaklaşımdır. Yaklaşım zayıf veya yanıltıcı ise, model faydasızdır. Bu konuşmada doğru modeller olmayan doğru modellere örnekler verdim. “Yanlış” bir model nosyonunun yanlış sonuçlara yol açabileceğini göstermektedir.
Benim için asıl içgörü şu açıdan yatmaktadır:
Bir modelin faydalı olması için doğru olması gerekmez.
Maalesef birçok bilimlerde, modellerin yeni keşiflere ve tahminlere izin vermek için gerçekliğin kesin temsilleri olması gerekmediği sık sık unutulur!
Bu nedenle, zamanınızı değişkenlerin sayısız değişkeninin doğru ölçülmesini gerektiren karmaşık bir model oluşturmak için harcamayın. Gerçek deha, işi yapan basit bir model icat eder.
Bir model, sonuçlarda herhangi bir rasgelelik varsa,% 100 doğru tahminler sağlayamaz. Belirsizlik yoksa, rastgelelik yoksa ve hata yoksa, o zaman bir modelden ziyade bir gerçek olarak kabul edilirdi. İlki çok önemlidir, çünkü modeller sıklıkla gerçekleşmemiş olayların beklentilerini modellemek için kullanılır. Bu neredeyse gerçek olaylarla ilgili bazı belirsizliklerin olduğunu garanti eder.
Mükemmel bilgi verildiğinde, teoride kesin olarak bilinen olaylar için mükemmel tahminler veren bir model oluşturmak mümkün olabilir. Bununla birlikte, bu olası durumlar göz önüne alınmasa bile, böyle bir model, hesaplama açısından kullanılamaz hale gelebilecek kadar karmaşık olabilir ve diğer faktörler değerlerin olaylarla nasıl değiştiğini değiştirdiğinden, yalnızca belirli bir anda doğru olabilir.
Belirsizlik ve rastgelelik çoğu gerçek dünya verilerinde mevcut olduğundan, mükemmel bir model elde etme çabaları boşuna bir alıştırmadır. Bunun yerine, hem veri hem de kullanımı için gereken hesaplama açısından kullanılabilecek kadar basit, yeterince kesin bir model elde etmeye bakmak daha değerlidir. Bu modellerin kusurlu olduğu bilinmesine rağmen, bu kusurların bazıları iyi bilinmektedir ve modellere dayalı karar alma için düşünülebilir.
Daha basit modeller, kusurlu olabilirler ancak birbirleriyle karşılaştırmak, birbirleriyle karşılaştırmak için daha kolay olabilirler ve çalışmak daha kolay olabilir çünkü daha az hesaplama gerektiriyorlardı.
Eğer yapabilirsem, bir yorumdan daha fazlası faydalı olabilir. Tercih ettiğim ifadenin versiyonu
(...) tüm modeller yaklaşık değerlerdir. Temel olarak, tüm modeller yanlış, ancak bazıları kullanışlıdır (...)
alınan cevap Yüzeyler, karışımları ve Ridge Analiz Box ve Draper (2007, s. 414, Wiley). Genişletilmiş alıntı baktığımızda bunun Kutu ne demek daha açık - istatistiksel modelleme hakkında yaklaşan gerçeği ve en bulma konusunda bu yüzden yaklaşım, tam asla uygun tahminini. Amacınız için uygun olan öznel bir şeydir, bu yüzden faydalı olan modellerden biri değil , modelleme amacına bağlı olarak muhtemelen bazılarıdır .
Kimse eklemediği için, George Box bir sonraki bölüme bir kitapta alıntı yapmak için alıntılanan aşamayı kullandı. Ne demek istediğini açıklamak için en iyi işi yaptığına inanıyorum:
Böyle bir model için, "Model doğru mu?" Sorusunu sormaya gerek yoktur. Eğer “gerçek” “gerçek” ise, cevap “Hayır” olmalıdır. Tek ilgi konusu “Model aydınlatıcı ve kullanışlı mı?” Dır.
Box, GEP (1979), "Bilimsel model kurma stratejisinde sağlamlık", Launer, RL; Wilkinson, GN, İstatistikte Sağlamlık , Academic Press, ss. 201-236.
Bunu bu şekilde düşünebilirsin. Bir nesnenin maksimum karmaşıklığı (yani entropi), Bekenstein sınırının bir tür şekline uyar :
Çoğu durumda bu büyük bir sayı:
Öyleyse, her hücredeki tüm parçacıklar için tüm dalga denklemleriyle "en iyi haritayı", yani bölgenin kendisini mi kullanmak istiyorsunuz? Kesinlikle hayır. Yalnızca hesaplamalı bir felaket değil, aynı zamanda önemsediğiniz şeyle ilgisi olmayan şeyleri modelleyeceksiniz. Tek yapmak istediğin, uyanık olup olmadığımı tanımlamaksa, elektron # 32458'in nöron # 844030 ribozom # 2305 molekül # 2'de ne yaptığını bilmenize gerek yoktur. Bunu modellemezseniz, modeliniz gerçekten "yanlıştır" dır, ancak uyanık olup olmadığımı belirleyebilirseniz modeliniz kesinlikle faydalıdır.
Bence Peter ve user11852 harika cevaplar verdi. Ben de (olumsuzlayarak) bir model gerçekten iyi olsaydı, muhtemelen aşırı giyinme (dolayısıyla genelleştirilemez) nedeniyle işe yaramaz olacağını eklerdim.
Asit yorumum şudur: Matematiksel bir modelin tüm faktörleri tam olarak tanımladığına inanmak ve ilgilendikleri bir olayı yöneten etkileşimleri çok basit ve kibirli olacaktır. Kullandığımız mantığın evreni anlamaya yeterli olup olmadığını bile bilmiyoruz. Bununla birlikte, bazı matematiksel modeller, bu fenomen hakkında sonuç çıkarmak için yararlı olan (bilimsel yöntem açısından) yeterince iyi bir yaklaşımı temsil eder.
Bir astrostatist (belki de nadir bir cins) olarak, Box'ın özdeyişinin ününü talihsiz buluyorum. Fiziksel bilimlerde, gözlemlenen bir olgunun altında yatan süreçleri anlamak için genellikle güçlü bir fikir birliğine sahibiz ve bu süreçler genellikle yerçekimi, kuantum mekaniği, termodinamik vb. Kanunlarından kaynaklanan matematiksel modeller ile ifade edilebilir. En uygun model, fiziksel özelliklerin yanı sıra model seçimi ve doğrulama parametrelerini de değiştirir. Avrupa Uzay Ajansı'nın Planck uydusundan bildirilen Mart 2013 tarihli bildiri yayınından çıkan çarpıcı bir vaka.'in Big Bang için 6 parametreli “LambdaCDM” modelini ikna edici bir şekilde kuran kozmik mikrodalga altyapısının ölçümleri. Box'ın belirdisinin, bu 29 makalede kullanılan çok çeşitli gelişmiş istatistiksel yöntemlerin herhangi bir yerinde uygulanacağından şüpheliyim.
Süreç modellerini odak noktası olarak kabul ederek yukarıdaki cevabı az önce değiştirdim. Açıklama şu şekilde yorumlanabilir:
“Tüm modeller yanlış”, yani her model yanlıştır çünkü gerçekliğin basitleştirilmesidir. Bazı modeller sadece biraz yanlış. Bazı şeyleri görmezden gelirler, Örneğin: -> gereksinimleri değiştirme, -> Son teslim tarihine kadar projenin tamamlanmasını görmezden gelme, -> müşterinin istediği kalite seviyesini göz önünde bulundurmama vb ... Diğer modeller çok yanlış daha büyük şeyler. Klasik yazılım süreç modelleri, daha az görmezden gelen çevik süreç modellerine kıyasla çok fazla dikkate almaz.
"Ancak bazıları yararlıdır" - gerçekliğin basitleştirilmesi oldukça yararlı olabilir. Genel projeyi ve tüm bileşenlerini açıklamamıza, tahmin etmemize ve anlamamıza yardımcı olabilirler. Modeller, özellikleri çoğu yazılım geliştirme programına karşılık geldiğinden kullanılır.
"Yararlı" teriminin başka bir yorumunu yapmak istiyorum. Muhtemelen Box'ın düşündüğü değil.
Karar vermeniz gerektiğinde ve bu, tüm bilgilerin sonunda kullanılacağı şeydir, o zaman başarınızı bir biçimde ölçmeniz gerekir. Belirsiz bilgileri olan kararlardan bahsederken, bu önleme genellikle fayda denir.
Bu yüzden daha faydalı kararlar vermemizi sağlayanlar olarak faydalı modelleri de düşünebiliriz ; hedeflerimize daha etkin bir şekilde ulaşmak için.
Bu, bir modelin doğru bir şekilde öngörüde bulunabilmesi gibi normal kriterlerin üstüne başka bir boyut ekler: Bir modelin birbirine karşı olduğu farklı yönleri tartmamıza olanak tanır.
"Tüm modeller yanlış, ancak bazıları kullanışlıdır". Belki de şu anlama gelir: Bildiklerimizle elimizden gelenin en iyisini yapmalıyız + yeni öğrenmeyi mi arıyorsunuz?
Remember that all models are wrong; the practical question is how wrong do they have to be to not be useful.
Belki bu daha yararlıdır.