Yüksek derecede doğrusal olmayan fonksiyonun takılması için strateji

Bir biyofizik deneyinin verilerini analiz etmek için, şu anda oldukça doğrusal olmayan bir modelle eğri uydurma yapmaya çalışıyorum. Model işlevi temelde şöyle görünür:

$y = ax + bx^{-1/2}$

Burada özellikle değeri büyük ilgi görüyor. $b$

Bu işlev için bir çizim:

İşlev grafiği

(Model işlevinin, sistemin ayrıntılı bir matematiksel açıklamasına dayandığını ve çok iyi çalıştığını görüyoruz - sadece otomatik uyumlar zor).

Tabii ki, model işlevi problemlidir: Ben şimdiye kadar denedim stratejileri uydurma, çünkü keskin asimptot başarısız , özellikle gürültülü verilerle. $x=0$

Buradaki sorunu anladığım kadarıyla, basit en küçük kareler uydurma (MATLAB'da hem doğrusal hem de doğrusal olmayan regresyonla oynadım; çoğunlukla Levenberg-Marquardt) dikey asimptota çok duyarlıdır, çünkü x'deki küçük hatalar büyük ölçüde güçlendirilmiştir. .

Biri beni bu sorunu çözebilecek uygun bir stratejiye yönlendirebilir mi?

Bazı temel istatistik bilgim var, ama bu hala oldukça sınırlı. Nereden bakmaya başlayacağımı bilseydim öğrenmeye hevesli olurdum :)

Tavsiyen için çok teşekkür ederim!

Düzenle Hatalardan bahsetmeyi unuttuğunuz için özür dileriz. Tek önemli gürültü cinsindendir ve katkı maddesidir. $x$

Düzenle 2 Bu sorunun arka planı hakkında bazı ek bilgiler. Yukarıdaki grafik bir polimerin gerilme davranışını modeller. @Whuber yorumlarda belirtildiği gibi, yukarıdaki gibi bir grafik elde etmek için gerekir. $b \approx -200 a$

İnsanların bu eğriyi bu noktaya kadar nasıl oturttuğuna gelince: insanlar genellikle iyi bir uyum bulana kadar dikey asimptodu kestiler. Bununla birlikte, kesim seçimi hala keyfi olup, takma prosedürünü güvenilir ve tekrarlanamaz hale getirir.

3 ve 4'ü düzenle Sabit grafik.

curve-fitting nonlinear

— onnodb
kaynak

Hatalar

veya

veya her ikisinde mi geliyor? Hangi formda gürültünün (çarpımsal, katkı maddesi vb.) Girmesini beklersiniz?

x

$x$

y

$y$

— olasılık

@onnodb: Endişem, modelinizin kendisinin ne kadar sağlam olduğunu temelden sorgulayamaz mı? Kullandığınız stratejiyi uydurma edilemez olduğunu olursa olsun

son derece hassas kalır?

için böyle bir tahmine hiç güvenemez misiniz?

b

$b$

b

$b$

— curious_cat

Ne yazık ki, bu hala işe yaramaz. Çizdiğiniz grafiği kalitatif olarak bile çoğaltabilecek olası

kombinasyonu yoktur . (Açıkçası

negatiftir.

, grafikteki en az eğimden daha az olmalı, ancak pozitif, bu da dar bir aralığa sokmalıdır. Ancak

bu aralıkta olduğunda , büyük negatif ani artışın üstesinden gelmek için yeterince büyük değildir. tarafından tanıtılan kökeni

dönem.) çizdiğiniz ne olacak? Veri? Başka bir işlev?

a

$a$

b

$b$

b

$b$

a

$a$

a

$a$

b x^{1 / 2}

$b x^{1/2}$

— whuber

(x, a x + b x^{1 / 2})

$(x,ax+bx^{1/2})$

x > 0

$x\gt 0$

(0, 3 b / (2 x^{1 / 2}))

$(0,3b/(2x^{1/2}))$

0

$0$

b

$b$

15.5

$15.5$ $y=ax + bx^{1/2}$

y = a x + b x^{1 / 2} + c

$y=ax+bx^{1/2}+c$

x

$x$

x

$x$

Yanıtlar:

Bunu manuel olarak sığdırmak için kullanacağımız yöntemler (yani Açıklayıcı Veri Analizi) bu verilerle oldukça iyi çalışabilir.

Parametrelerini olumlu hale getirmek için modeli biraz yeniden parametrelendirmek istiyorum :

y = a x - b / \sqrt{x} .

$y = a x - b / \sqrt{x}.$

$y$ $x$ $f(y; a,b)$ $f(y)$ $(a,b)$

$(x_i, y_i)$ $x_i$ $f(y_i; a,b)$ $100$ $a=0.0001$ $b=0.1$ $\sigma^2=4$

Veri grafiği

$x$ $\pm 2$ $5$ $6$ $x$ $a$ $b$ $\sigma^2$

$a$ $\hat{a}$ $\hat{b}$ $a$ $b$ $\hat{x}_i$ $x_i$ $b$ $x_i$ $(y_i)$ $x$ $x$ yeterince büyük,

x_{i} \approx \frac{1}{a} (y_{i} + \frac{\hat{b}}{\sqrt{{\hat{x}}_{i}}}) .

$x_i \approx \frac{1}{a}\left(y_i + \frac{\hat{b}}{\sqrt{\hat{x}_i}}\right).$

$\hat{a}$ $a$ $a$

$x$

x_{i} \approx b^{2} \frac{1 - 2 \hat{a} \hat{b} {\hat{x}}^{3 / 2}}{y_{i}^{2}} .

$x_i \approx b^2\frac{1 - 2 \hat{a} \hat{b} \hat{x}^{3/2}}{y_i^2}.$

$b$ $\hat{b}$

$x_i$ $1/y_i^2$ $x_i$ $x_i$ $y_i$ $x_i$ $1/y_i^2$ $y_i$ kırmızı renkte, en küçük yarısı mavi renkte ve başlangıç noktasında bir çizgi kırmızı noktalara sığar.

şekil

$x$ $y$ $x$ $b$ $0.096$ $4$

Bu noktada, öngörülen değerler şu şekilde güncellenebilir:

{\hat{x}}_{i} = f (y_{i}; \hat{a}, \hat{b}) .

$\hat{x}_i = f(y_i; \hat{a}, \hat{b}).$

Tahminler istikrara kavuşana kadar (bu garanti edilmez) veya küçük değer aralıkları (hala garanti edilemez) arasında dolaşana kadar yineleyin .

$a$ $x$ $b$ $\hat{a} = 0.000196$ $0.0001$ $\hat{b} = 0.1073$ $0.1$ ). Bu grafik, verileri bir kez daha gösterir; bu veriler (a) gerçek eğri gri renkte (kesikli) ve (b) tahmini eğri kırmızı renkte (katı):

Uyumlar

$3.73$ $4$

Bu yaklaşımla ilgili bazı sorunlar var:

Tahminler önyargılıdır. Veri kümesi küçük olduğunda ve nispeten az sayıda değer x eksenine yakın olduğunda sapma belirginleşir. Uyum sistematik olarak biraz düşüktür.
$y_i$ $y_i$
$a$ $b$

kod

Mathematica'da aşağıdakiler yazılmıştır .

estimate[{a_, b_, xHat_}, {x_, y_}] := 
  Module[{n = Length[x], k0, k1, yLarge, xLarge, xHatLarge, ySmall, 
    xSmall, xHatSmall, a1, b1, xHat1, u, fr},
   fr[y_, {a_, b_}] := Root[-b^2 + y^2 #1 - 2 a y #1^2 + a^2 #1^3 &, 1];
   k0 = Floor[1 n/3]; k1 = Ceiling[2 n/3];(* The tuning constants *)
   yLarge = y[[k1 + 1 ;;]]; xLarge = x[[k1 + 1 ;;]]; xHatLarge = xHat[[k1 + 1 ;;]];
   ySmall = y[[;; k0]]; xSmall = x[[;; k0]]; xHatSmall = xHat[[;; k0]];
   a1 = 1/
     Last[LinearModelFit[{yLarge + b/Sqrt[xHatLarge], 
          xLarge}\[Transpose], u, u]["BestFitParameters"]];
   b1 = Sqrt[
     Last[LinearModelFit[{(1 - 2 a1 b  xHatSmall^(3/2)) / ySmall^2, 
          xSmall}\[Transpose], u, u]["BestFitParameters"]]];
   xHat1 = fr[#, {a1, b1}] & /@ y;
   {a1, b1, xHat1}
   ];

xydata = {x,y} $a=b=0$

{a, b, xHat} = NestWhile[estimate[##, data] &, {0, 0, data[[1]]}, 
                Norm[Most[#1] - Most[#2]] >= 0.001 &,  2, 100]

— whuber
kaynak

Bu inanılmaz bir cevap; Çok mecburum! Bununla oynuyorum ve sonuçlar çok umut verici görünüyor. Yine de mantığı tam olarak anlamak için biraz daha zamana ihtiyacım olacak :) Ayrıca: Teşekkürler hakkında ek bir (özel) soru için web siteniz aracılığıyla sizinle iletişime geçebilir miyim?

— onnodb

Önemli sorulara bakın @probabilityislogic yayınlandı

$y^* = y\sqrt{x}$ $y^*$ $x^* = x^{3/2}$ $1/x$

$b$

$x$

Ek bilgileri dikkate almak için düzenleyin:

$y^* = b + a x^*$

Şimdi hataların x ve katkısı var. Halen bu ölçekte varyansın sabit olup olmadığını bilmiyoruz.

$x^* = y^*/a - b/a = m y^* + c$

$x_o^* = x^* + \eta$ $x$

$o$ $x_o^*$

$x^*_o = c + m y^* + \epsilon$ $\epsilon = -\zeta$ $x$ $y$

Bunun geliştiğinden emin değilim! Bu tür şeyler için yöntemler olduğuna inanıyorum, ama gerçekten benim alanım değil.

Yorumlarda ters gerilime bakmak isteyebileceğinizden bahsettim, ancak işlevinizin belirli şekli bundan kaçınmayı engelleyebilir.

Hatta bu lineer formda x-hatalarında oldukça sağlam yöntemleri denemede sıkışmış olabilirsiniz.

$y$

$x$

— Glen_b-Monica'yı eski durumuna döndür
kaynak

x

$x$

" hatalar x olsa bile " - evet, bu biraz önemli. Ters regresyonu kontrol etmek isteyebilirsiniz.

— Glen_b

... veya doğrudan modeline sığabilirsiniz

x = \frac{1}{3} (\frac{2 y}{a} + \frac{2^{1 / 3} y^{2}}{{(27 a^{4} b^{2} - 2 a^{3} y^{3} + 3 \sqrt{3} \sqrt{27 a^{8} b^{4} - 4 a^{7} b^{2} y^{3}})}^{1 / 3}} + \frac{{(27 a^{4} b^{2} - 2 a^{3} y^{3} + 3 \sqrt{3} \sqrt{27 a^{8} b^{4} - 4 a^{7} b^{2} y^{3}})}^{1 / 3}}{2^{1 / 3} a^{2}})

$x = \frac{1}{3} \left(\frac{2 y}{a}+\frac{2^{1/3} y^2}{\left(27 a^4 b^2-2 a^3 y^3+3 \sqrt{3} \sqrt{27 a^8 b^4-4 a^7 b^2 y^3}\right)^{1/3}}+\frac{\left(27 a^4 b^2-2 a^3 y^3+3 \sqrt{3} \sqrt{27 a^8 b^4-4 a^7 b^2 y^3}\right)^{1/3}}{2^{1/3} a^2}\right)$

x_{o}

$x_o$

x_{o}

$x_o$

x + ζ

$x + \zeta$

x = (t h a t m o n s t e r) + ϵ

$x = (\rm{that\,\, monster}) + \epsilon\,$

ϵ = - ζ

$\epsilon = -\zeta$

x (y)

$x(y)$

y

$y$

b

$b$

Birkaç haftalık deneyden sonra, bu özel durumda farklı bir teknik en iyi sonucu verir: Total En Küçük Kareler uydurma . Her zamanki (doğrusal olmayan) En Küçük Kareler bağlantısının bir çeşididir, ancak eksenlerden sadece biri boyunca (bu gibi oldukça doğrusal olmayan durumlarda sorunlara neden olan) uyum hatalarını ölçmek yerine, her iki ekseni de dikkate alır .

Konu ile ilgili mevcut olan çok sayıda makale, öğretici ve kitap var, ancak doğrusal olmayan durum daha zor. Hatta bazı MATLAB kodları da mevcut.

— onnodb
kaynak

y

$y$

y

$y$

@whuber Endişelerinizi ifade ettiğiniz için teşekkür ederiz! Şu anda, TLS bağlantısının güvenilirliğini araştırmak için simülasyonlar üzerinde çalışıyorum. Şimdiye kadar gördüğüm şey, TLS'nin her iki değişkeni de dikkate alması, modelin yüksek doğrusal olmama durumunun üstesinden gelmede çok yardımcı oluyor. Simüle edilmiş verilerin uyumu güvenilirdir ve çok iyi yakınsar. Yine de daha fazla işin yapılması gerekiyor ve daha gerçek veriler elde edildikten sonra yönteminizi buna göre biriktirmem gerekecek ve endişelerinize ayrıntılı bir şekilde bakacağım.

— onnodb

Tamam - Unutmayın, önerdiğim yöntem hakkında karşılaştırılabilir endişelerim var!

— whuber