, tek başına uyum iyiliğinin iyi bir tedbir değil, ama burada o içine almak olduğunu gözlemlemek hariç etmeyelimparsimonimodelleme değer biçilir.R2
Bu amaçla, not bu standart teknikler Veri Analizi (EDA) ve regresyon (ama yok aşamalı ya da diğer otomatik prosedürleri) şeklinde bir doğrusal model kullanılarak önermek
f−−√=a+b∗c+a∗b∗c+constant+error
OLS kullanarak, bu elde edecek 0.99 üzerindedir. Bu tür bir sonuç cesaret verici bir her iki taraf ve gerileme kare için cazip olduğunu f ile bir , b * c , bir * b * c , ve tüm kareler ve ürünler. Bu hemen bir model üretirR2fab∗ca∗b∗c
f=a2+b∗c+constant+error
34 altındaki bir kök MSE ve ile ayarlanmış 0,9999 arasındaR2 . 1.0112 ve 0.988’in tahmini katsayıları, verilerin formülle yapay olarak üretilebileceğini göstermektedir
f=a2+b∗c+50
artı yaklaşık 50'ye eşit SD normalde dağılmış küçük bir hata.
Düzenle
@ Knorv'ın ipuçlarına yanıt olarak, analize devam ettim. Bunu yapmak için, şimdiye kadar başarılı olan teknikleri kullandım, artıkların saçılma matrislerinin orijinal değişkenlere karşı incelenmesiyle başladım. Tabii ki, arasındaki ilişki net bir belirti yoktu ve artıklar (hatta EKK regresyonu olsa f karşı bir , bir 2 ve b * c vermedi değil belirtmek bir "önemli" olduğunu). Bu damarda devam ben kuadratik terimler arasındaki tüm korelasyonlar araştırdı bir 2 , ... , e 2 , bir *afaa2b∗ca ve yeni artıklar ve b 2 ile küçük ama oldukça önemli bir ilişki buldu. "Çok önemli", tüm bu meraklıların, 20 farklı değişkene bakmayı içerdiği anlamına gelir; bu nedenle, bu balıkçılık keşif gezisindeki önem ölçütüm yaklaşık 0,05 / 20 = 0,0025'tir: daha az sıkı olan herhangi bir şey, uyum için sondalamanın bir ürünü olabilir.a2,…,e2,a∗b,a∗c,…,d∗eb2
Bunun “ilginç” ve “basit” katsayılarla ilişkileri beklediğimiz ve dolayısıyla aradığımız fiziksel bir modelin tadı bir şeydir. Yani, örneğin, tahmini katsayısı olduğunu görünce -0,0092 (% 95 güven ile -0,005 ila -0.013) idi, bunun için -1/100 kullanmak seçildi. Bu, sosyal ya da politik bir sistemin gözlemleri gibi başka bir veri seti olsaydı, böyle bir değişiklik yapmazdım, sadece OLS tahminlerini olduğu gibi kullanırım.b2
Neyse, daha iyi bir uyum
f=a+a2+b∗c−b2/100+30.5+error
ortalama artık , standart sapma 26.8, -50 ile +43 arasındaki tüm artıklar ve normal olmayan bir kanıt bulunmamakla birlikte (bu kadar küçük bir veri setinde hatalar eşit bir şekilde dağıtılabilse de bir tanesi gerçekten farkı söyleyememiştir). Artık standart sapmada yaklaşık 50'den 25'e düşme, genellikle "artık varyansın% 75'ini açıklamak" olarak ifade edilir.0
birb2
BTW, sağlam regresyon kullanarak modele uyabilirim
f= 1,0103 bir2+ 0.99493 b ∗ c - 0.007 b2+ 46.78 + hata
27.4 artık SD ile ve -51 ve +47 arasındaki tüm artıklar: esasen önceki uyum kadar iyi fakat bir daha az değişken olan. Bu anlamda daha ayrıcalıklı, fakat katsayıları "güzel" değerlere yuvarlamadığım için daha az ayrıcalıklı. Bununla birlikte, bu genellikle bir regresyon analizinde tercih edeceğim formdur, katsayıların ne tür değerlere sahip olması gerektiği ve hangi değişkenlerin dahil edilmesi gerektiği konusunda kesin teoriler yoktur.
R,2
FF
, "yanma verimi" veAA
yakıtBB
miktarı ve oksijen miktarı olsaydı,AA
veBB