Hatanın lojistik büyüme verileri etrafındaki dağılımı nedir?


10

Ekolojide genellikle lojistik büyüme denklemini kullanırız:

Nt=KN0ertK+N0ert1

veya

Nt=KN0N0+(KN0)ert

burada taşıma kapasitesidir (ulaşılan maksimum yoğunluk), başlangıç ​​yoğunluğu, büyüme oranıdır, başlangıçtan beri geçen süredir.KN0rt

değerinin yumuşak bir üst sınırı ve bir alt sınırı , güçlü bir alt sınırı .Nt(K)(N0)0

Ayrıca, özel bağlamımda, ölçümleri , her ikisi de teorik bir maksimuma ve dolayısıyla güçlü bir üst olan optik yoğunluk veya flüoresans kullanılarak yapılır.Nt

Bu nedenle etrafındaki hata muhtemelen en iyi şekilde sınırlı bir dağılımla tanımlanır.Nt

küçük değerlerinde dağılım muhtemelen güçlü bir pozitif sahipken, yaklaşan değerlerinde dağılım muhtemelen güçlü bir negatif sahiptir. Dolayısıyla dağıtım muhtemelen bağlanabilen bir şekil parametresine sahiptir .NtNtNt

Varyans ile de artabilir .Nt

İşte grafik bir örnek

resim açıklamasını buraya girin

ile

K<-0.8
r<-1
N0<-0.01
t<-1:10
max<-1

r ile üretilebilen

library(devtools)
source_url("https://raw.github.com/edielivon/Useful-R-functions/master/Growth%20curves/example%20plot.R")
  • etrafında teorik hata dağılımı ne olurdu (hem model hem de sağlanan ampirik bilgiler dikkate alınarak)?Nt

  • Bu dağılımın parametreleri veya zamanın değeri ile ilişkilidir (eğer parametreler kullanılıyorsa, mod ile doğrudan ilişkilendirilemez, örn. normal)?NtNt

  • Bu dağılım uygulanan bir yoğunluk fonksiyonuna sahip mi?R

Şu ana kadar keşfedilen yol tarifleri:

  • etrafında normallik varsayılması ( aşırı tahminlerine yol açar )NtK
  • etrafında normal dağılım , ancak alfa ve beta şekil parametrelerini yerleştirmede zorlukNt/max
  • mantığı etrafında normal dağılımNt/max

1
Hatanın dağılımına odaklanarak, bu soru bir model hakkında karmaşık düşünmeyi yansıtır, ancak işlevsel bir form için hata dağıtımının formun kendisiyle herhangi bir ilişkisi olmadığını lütfen unutmayın . Geçerli cevap maddeleri yerine büyüme doğal varyasyonlar ile ilgili oluşur hakkında bilgi bulunabilir olan ve muhtemel model yanlış özellikleri hakkında, (zorunlu olarak hata emilecek) zaman içinde, ve nasıl ( ve ) ölçülür. KrNtt
whuber

@whuber, son bir düzenlemede bazı yorumlarınızı ele almaya çalıştım.
Etienne Low-Décarie

1
Gürültü dağılımının özelliklerini sahip olduğunuz şekilde karakterize edebiliyorsanız, bu özelliklerle parametrik bir form seçebileceğinizi düşünün. Ben aile özetlemek gerektiğini düşünüyorum 1. sonlu bir aralıkta tanımlanmalıdır, 2. sol eğim, sağ eğim ve simetri sağlar. ve 3. Nt arttıkça artan bir varyansa sahiptir. Beta dağılımı 1 ve 2 için faturaya uyar. Sabit aralık [0, 1] 'dir. Bu nedenle varyansın artmasına izin vermek için, dağılımı intervsl [0, c] 'ye yayan bir c parametresi ekleyebiliriz.
Michael R.Chernick

Yanıtlar:


3

Michael Chernick'in belirttiği gibi, ölçeklendirilmiş beta dağılımı bunun için en iyi mantıklı. Ancak, tüm pratik amaçlar için ve ASLAmodeli mükemmel bir şekilde düzeltin, sadece lojistik büyüme denkleminize göre ortalamayı doğrusal olmayan regresyon ile modellemek ve bunu heteroskedastisiteye dayanıklı standart hatalarla sarmak daha iyi olur. Bunu maksimum olabilirlik bağlamına koymak, yanlış bir büyük doğruluk hissi yaratacaktır. Ekolojik teori bir dağıtım üretecekse, bu dağılıma uymalısınız. Teoriniz yalnızca ortalama için tahmin üretiyorsa, bu yoruma sadık kalmalısınız ve tam gelişmiş bir dağıtım gibi bundan başka bir şey bulmaya çalışmamalısınız. (Pearson'un eğriler sistemi kesinlikle 100 yıl önce süslüydü, ancak rastgele süreçler yoğunluk eğrilerini üretmek için diferansiyel denklemleri takip etmiyor, bu da bu yoğunluk eğrileri ile motivasyonu - bunun yerine,Nt - Poisson dağılımını örnek olarak düşünüyorum - ve bu etkinin ölçekli beta dağıtımı tarafından yakalanacağından tam olarak emin değilim; Aksine, ortalamayı teorik üst sınırına doğru çekerken sıkıştırmanız gerekir, ki bunu yapmanız gerekebilir. Senin Eğer ölçüm cihazı bir üst ölçümlerin bağlı olan, bu anlamına gelmez, gerçek süreçbir üst sınırı olmalıdır; İşlem, makul bir şekilde doğru bir şekilde ölçülmenin üst sınırına ulaştığında, cihazlarınız tarafından verilen ölçüm hatasının kritik hale geldiğini söyleyebilirim. Ölçümü temeldeki işlemle karıştırırsanız, bunu açıkça tanımalısınız, ancak işlemle ilgili olarak cihazınızın nasıl çalıştığını açıklamaktan daha büyük bir ilginiz olduğunu hayal ediyorum. (Süreç bundan 10 yıl sonra gerçekleşecek; yeni ölçüm cihazları kullanılabilir hale gelebilir, böylece işiniz eski hale gelecektir.)


Çok teşekkürler! Süreç ve tedbirin ayrılmasının ilginç olduğunu kabul ediyorum. Bununla birlikte, çoğu ölçüm yönteminin bu güçlü üst sınıra sahip olduğunu öneririm, ancak bunu izole etmek önemli olabilir. Ölçekli beta'yı nerede kullanırsam, MLE uydurma güveni hakkındaki uyarınıza rağmen, MLE'ye izin vermek için değişkenleri modellemek için şekil parametrelerini bu sistemle nasıl ilişkilendireceğinize dair herhangi bir öneriniz var mı?
Etienne Low-Décarie

Uygulamanızda sınırlarınızın gerçekten önemli olduğuna ikna olduysanız, sadece bu ölçekli betaya sadık kalabilirsiniz. Söylediğim tek şey ikna olmadığım. Kesilen veriler için, bildiğiniz tek şey, gerçek değerin ölçebileceğiniz maksimum değeri aştığıdır; bazen gelirlerin en üst kodlaması ile birlikte kullanılırken, gizlilik nedenleriyle 100K ABD Doları / yıl'dan daha yüksek gelirler 100K ABD Doları / yıla indirilir.
StasK

1

@whuber, bu modelin yapısal kısmının hata terimlerinin dağılımı ile gerekli bir ilişkisinin olmadığı doğrudur. Yani teorik hata dağılımı için sorunuzun cevabı yok.

Bu, bunun iyi bir soru olmadığı anlamına gelmez - sadece cevabın büyük ölçüde ampirik olması gerekir.

Rasgeleliğin katkı maddesi olduğunu varsayıyorsunuz. Bunun olması için (hesaplama kolaylığı dışında) hiçbir neden göremiyorum. Modelde başka bir yerde rastgele bir elemanın var mı? Örneğin, rasgeleliğin ortalama olarak 1 ile dağıtıldığı haliyle aşağıdakilere bakın, tahmin edilecek tek şey varyans. Bunun yapmak istediğiniz doğru şey olduğunu düşünmek için hiçbir nedenim yok, görmek istediğinizle eşleşiyor gibi görünen makul sonuçlar üretiyor. Bilmediğim bir modeli tahmin etmenin temeli olarak böyle bir şey kullanmanın pratik olup olmayacağı.

loggrowth <- function(K, N, r, time, rand=1){
    K*N*exp(rand*r*time)/(K+N*exp(rand*r*time-1)))}

plot(1:100, loggrowth(100,20,.08,1:100, rnorm(100,1,0.1)), 
    type="p", ylab="", xlab="time")
lines(1:100, loggrowth(100,20,.08,1:100))

resim açıklamasını buraya girin


Bu durumda sıfırın altında ve sert üst sınırın üstünde Nt değerleriniz olabilir. Ayrıca, tüm parametrelerde (zamana sahip bir parametrenin ürününde olması gerekmez) gürültü, dolayısıyla yanıt değişkenindeki gürültü beklenir. Yine de yaklaşımınızın maksimum olabilirlik yorumuyla ilgileniyorum.
Etienne Low-Décarie

Bu, dağıtımın her bir Nt için sınırlanmasına izin vermez ve gürültü bileşeninin eğrilmesine izin vermez. Ölçekli bir beta dağılımı fikrimin literatürde kullanılıp kullanılmadığını bilmiyorum, ancak kısıtlamaları iyi karşılar. Denemedim ama belki maksimum olasılık denenebilir. Emin değilim ama belki c olasılık tahminine dahil edilirse bir sorun olurdu. Belki c sadece Nt'ye göre ayrı ayrı tahmin edilebilir ve daha sonra modelin geri kalanı her sabit Nt için maksimum olasılıkla sığabilir.
Michael R.Chernick

Sadece yüksek sesle düşünüyorum. Herkes bu sorunun iyi bir araştırma makalesine dönüştürülebileceğini düşünüyor mu?
Michael R.Chernick

1966'dan bir makale buna biraz baktı, ancak bir tane daha görmedim. Belki o zamandan beri işler değişti? jstor.org/discover/10.2307/…
Etienne Low-Décarie

Bu rotaya gitmeye karar verirseniz lütfen bize bildirin.
Etienne Low-Décarie
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.