Bu başparmak kuralını seviyorum:
Eğer göz rehberlik hattını gerekiyorsa (yani çizgi olmadan şeklinde açıkça görülebilir olmayacağını bir eğilim göstermek için), sen gerektiğini değil çizgiyi koydu.
İnsanlar kalıpları tanımada son derece iyidir (mevcut bir eğilimi kaçırmaktan ziyade var olmayan eğilimleri görmenin yanındayız). Eğilimi çizgisiz olarak elde edemezsek, veri setinde hiçbir eğilimin kesin olarak gösterilemeyeceğinden emin olabiliriz.
İkinci grafikten bahsederken, ölçüm noktalarınızın belirsizliğinin tek göstergesi, 700 ° C'de C: O 1.2'nin iki kırmızı karesidir. Bu ikisinin yayılması, kabul etmeyeceğim anlamına gelir.
- C: O 1.2 için bir eğilim olduğunu
- 2.0 ve 3.6 arasında bir fark olduğunu
- ve elbette kavisli modeller verilere uyuyor.
çok iyi sebepler olmadan. Ancak bu yine bir model olacaktır.
edit: Ivan'ın yorumuna cevap:
Ben kimyacıyım ve hatasız bir ölçüm olmadığını söyleyebilirim - kabul edilebilir olan deney ve cihaza bağlı olacaktır.
Bu cevap deneysel hatayı göstermeye karşı değil, hepsini göstermek ve hesaba katmak içindir.
Akıl yürütmemin arkasındaki fikir, grafiğin tam olarak bir tekrarlanan ölçüm göstermesidir, bu nedenle tartışma, bir modelin ne kadar karmaşık olması gerektiği (yani yatay çizgi, düz çizgi, ikinci dereceden, ...) olduğunda, bu bize ölçüm hakkında bir fikir verebilir. hata. Sizin durumunuzda, bu, kuadratik olması gerektiğini gösteren sert bir modeliniz (örn. Termodinamik veya kinetik denklem) olsa bile, anlamlı bir kuadratik (spline) sığamayacağınız anlamına gelir - yeterli veriye sahip değilsiniz. .
Bunu göstermek için:
df <-data.frame (T = c ( 700, 700, 800, 900, 700, 800, 900, 700, 800, 900),
C.to.O = factor (c ( 1.2, 1.2, 1.2, 1.2, 2 , 2 , 2 , 3.6, 3.6, 3.6)),
tar = c (21.5, 18.5, 19.5, 19, 15.5, 15 , 6 , 16.5, 9, 9))
İşte C: O oranlarının her biri için% 95 güven aralığı ile birlikte doğrusal bir uyum:
ggplot (df, aes (x = T, y = tar, col = C.to.O)) + geom_point () +
stat_smooth (method = "lm") +
facet_wrap (~C.to.O)
Daha yüksek C: O oranları için güven aralığının 0'ın çok altında olduğunu unutmayın. Bu, doğrusal modelin örtülü varsayımlarının yanlış olduğu anlamına gelir. Ancak, daha yüksek C: O içerikleri için doğrusal modellerin zaten gereğinden fazla olduğu sonucuna varabilirsiniz.
Bu nedenle, geri adım atmak ve sadece sabit bir değere uymak (yani T bağımlılığı yok):
ggplot (df, aes (x = T, y = tar, col = C.to.O)) + geom_point () +
stat_smooth (method = "lm", formula = y ~ 1) +
facet_wrap (~C.to.O)
Tamamlayıcı C: O'ya bağımlılık modellememektir:
ggplot (df, aes (x = T, y = tar)) + geom_point (aes (col = C.to.O)) +
stat_smooth (method = "lm", formula = y ~ x)
Yine de, güven aralığı yatay veya hatta biraz artan çizgileri kapsayacaktır.
Devam edebilir ve örneğin, üç C: O oranı için farklı ofsetlere izin vermeyi, ancak eşit eğimler kullanmayı deneyebilirsiniz.
Bununla birlikte, daha az sayıda ölçüm durumu büyük ölçüde iyileştirecektir - C: O = 1: 1 için güven aralıklarının ne kadar daha dar olduğuna dikkat edin, burada sadece 3 yerine 4 ölçümünüz vardır.
Sonuç: Şüpheci olacağım sonuçlarımı karşılaştırırsanız, mevcut birkaç noktaya çok fazla okuyorlardı!