Aynı modeldeki regresyon katsayılarını farklı veri kümelerinde karşılaştırma


12

Aynı soğutma sisteminde kullanılan iki (2) soğutucu akışkanı (gaz) değerlendiriyorum. Değerlendirme için doymuş emme sıcaklığı ( ), yoğuşma sıcaklığı ( ) ve amper ( ) verilerim var. İki (2) veri kümesi vardır; 1. soğutucu akışkan ( ) ve 2. soğutucu akışkan ( ). Regresyon analizleri için doğrusal, çok değişkenli ( & ), 3. dereceden bir polinom modeli kullanıyorum. Yüzde olarak ikinci soğutucu akışkan tarafından ortalama olarak ne kadar az / daha fazla amper (veya performans karşılaştırmasına benzer bir metrik) belirlendiğini belirlemek istiyorum.D Y R 1 R 2 S DSDYR1R2SD

İlk düşüncem şuydu:

  1. Kullanılacak modeli belirleyin:Y=b0+b1S+b2D+b3SD+b4S2+b5D2+b6S2D+b7D2S+b8D3+b9S3
  2. Temel verilerden ( ) katsayıları ( ) elde edin .R 1biR1
  3. Bu katsayıları kullanarak , veri kümesindeki her bir & için, beklenen her amp çekimi ( ) ve ardından ortalamayı hesaplayın .D R, 2 , YSDR2Y^
  4. Karşılaştırma gerçek ortalama amper çizmek (ortalama arasında) verileri. Y2R '2Y^Y2R2
  5. percent (%) change=(Y2Y^)/Y^

Bununla birlikte, 2. soğutucu akışkanın biraz farklı termal özellikleri olduğundan ve soğutma sisteminde küçük değişiklikler yapıldığı için (TXV ve aşırı ısınma ayarları) Bu 'temel karşılaştırma yönteminin' doğru olduğuna inanmıyorum.

Bir sonraki düşüncem iki (2) ayrı regresyon analizi :

Y1=a0+a1S1+a2D1+a3S1D1+a4S12+a5D12+a6S12D1+a7D12S1+a8D13+a9S13Y2=b0+b1S2+b2D2+b3S2D2+b4S22+b5D22+b6S22D2+b7D22S2+b8D23+b9S23

ve daha sonra doymuş emme sıcaklığı ( ) için katsayıları ( vs ) şu şekilde karşılaştırın: Sa1b1

% change=b1a1a1

Bununla birlikte, yine, bu katsayılar farklı şekilde ağırlıklandırılmalıdır. Bu nedenle, sonuçlar çarpık olacaktır.

Katsayıların ne kadar farklı ağırlıklı olduğunu belirlemek için bir z testi kullanabileceğime inanıyorum, ancak çıktının anlamını tam olarak anladığımdan emin değilim: . Ancak, bu hala genel bir hedef olan bir performans metriği vermeyecekti.z=(a1b1)/SEa12+SEb12)


1
1. Bir polinom modeli doğrusal bir modeldir, çünkü katsayısında doğrusaldır. 2. Sorunuzu anlamaya çalışıyorum. Soğutma sistemi R1 ve R2'nin kullanıldığı zaman arasında değiştirildiyse, bunlar gerçekten 'aynı soğutma sistemi' (hat 1) değildir, değil mi? 3. Neden ikinci yaklaşımınızda, S katsayılarını karşılaştırmaya başladınız? 4. Polinom uyumuna (belki de etkileşim ile) R1 ve R2 seviyelerine sahip ortak bir 'soğutucu akışkan' dahil etmeyi düşünüyor musunuz? Katsayısı soruya cevap verebilir.
qoheleth

@qoheleth 1. Düşünce çizginizi takip ettiğimden emin değilim ... Katsayı her zaman doğrusaldır - bu bir sayıdır. Peki katsayı ne zaman doğrusal olmaz? 2. Doğru, soğutma sistemi ÇOK değişti, ama sadece her iki soğutucu için aynı çıkış sıcaklığını sağlamak için - "elma elma". 3. 'S', bu spesifik karşılaştırmanın tek değişkenidir. 4. Değişken / etkileşen değişken yöntemini okudum, ancak böyle bir yöntemi kullanarak katsayıların anlamını anlayamadım. Çıktıyı yorumlamaktan bahseder misiniz? Teşekkür ederim.
gth826a

1. istatistiksel bakış açısından, tahmin ettiğiniz şeylerde doğrusallık ne kadar sayılır, bu yüzden bir polinom modeli doğrusal. Doğrusal olmayan bir modele örnek olarak mitscherlich fonksiyonu y = alpha (1-exp (beta-lambda * X)) verilebilir; burada alfa / beta / lambda tahmin ettiğimiz şeydir. 3. Gerçekten neyi test etmeye çalışıyorsunuz? S katsayısı mı? veya Y? S ise, 1. denemeniz neden \ hat {Y} 'da bir karşılaştırma yapıyor?
qoheleth

Y-şapkası şöyle olacaktır: 1. veri kümesinden türetilen katsayılarla kullanılan 2. veri kümesinden gerçek S & D. Bu yöntem, önceki donanımın enerji tüketimini, sonradan uyarlama / tadilat / yenileme / vb. Sonrası enerji tüketimiyle karşılaştırırken 'Performans Taahhüt' enerji analizleri için yaygındır. Denklem şöyledir: enerji tüketimi = y-şapka = baz yük + enerji / derece-gün * derece-günler ... burada enerji / derece-gün temel regresyon analizinden elde edilen katsayıdır ve derece-günler yenileme sonrasıdır . Bu proje senaryosunu
yapmasaydınız

1
Sonuçta Y'yi karşılaştırmak istiyorsunuz gibi görünüyor. Katsayılarda% değişimi hesaplamayı unutun, daha yüksek dereceli terimlerin (S ^ 2, S ^ 3 vb.) Varlığında, katsayılar düşündüğünüz şey değildir. onlar. Bana odaklanmam gereken soru şudur: R2'deki S&D, R1'deki S&D için farklı şeyler ifade ediyor mu? Değilse, o zaman soğutucu (r1 veya r2) adı verilen ekstra bir değişken (X değişkeni) ile birleştirilmiş veri kümesine bir model takabilir ve modelinizin yeterli olduğunu varsayarak çıkarım yapmak için katsayısına bakabilirsiniz.
qoheleth

Yanıtlar:


2

İdeal gaz yasasından burada , orantılı model önerirken,. Ünitelerinizin mutlak sıcaklıkta olduğundan emin olun. Orantılı bir sonuç istemek orantılı bir hata modeli anlamına gelir. Belki düşünün, o zaman çoklu doğrusal regresyon için logaritmaları alarak . Y, D ve G değerleri, bu nedenle bu daha sonra benzer olduğu , simgeler ortalama "logaritmasını." Şimdi, bu, kullandığınız doğrusal modelden daha iyi çalışabilir ve yanıtlar göreceli hata türüdür.PV=nRTY=aDbScln(Y)=ln(a)+bln(D)+cln(S)Yl=al+bDl+cSll

Hangi modelin kullanılacağını doğrulamak için birini deneyin ve artıkların homossedastik olup olmadığını kontrol edin. Öyleyse , önyargılı bir modeliniz varsa , o zaman logaritmaları modellemek gibi başka bir şey yapın, yukarıdaki gibi, kalıntılar homoscedastik olana kadar bir veya daha fazla x veya y verisi karşılıklılığı, kare kökler, kareleme, üs alma ve benzeri. Model homoscedastik kalıntılar veremezse, gerekirse sansürleme ile çoklu doğrusal Theil regresyonunu kullanın.

Verilerin y ekseninde ne kadar normal dağıtıldığı gerekli değildir, ancak aykırı değerler regresyon parametresi sonuçlarını belirgin şekilde bozabilir ve bozabilir. Homoscedastisite bulunamazsa, normal en küçük kareler kullanılmamalı ve örneğin, ağırlıklı regresyon, Theil regresyonu, x cinsinden en küçük kareler, Deming regresyonu vb. Gibi başka bir tür regresyon gerçekleştirilmelidir. Ayrıca, hatalar seri olarak ilişkilendirilmemelidir.

Çıktının anlamı: , olabilir veya olmayabilir ilgili. Bu, toplam varyansın iki bağımsız varyansın toplamı olduğunu varsayar. Bunu başka bir deyişle, grafiğinde bağımsızlık diktir (diklik) . Yani, toplam değişkenlik (varyans) daha sonra Pythagorean teoremini takip eder, , verileriniz için böyle olabilir veya olmayabilir. Bu durumda, devleti göreceli bir mesafedir, yani, standart sapmalar (SD) bölünmüş olan Pisagor, AKA vektörü, standart hatanın (SE) bölünmesiyle bölünmüş ortalamalar (mesafe) farkıdır. tarafından x,yH=+z=(a1b1)/SEa12+SEb12)x,y zH=+A2+O2zNburada SE'lerin kendileri de mesafelerdir. Bir mesafeyi diğerine bölmek onları normalleştirir, yani ortalamalardaki farkın toplam (standart) hataya bölünmesi, daha sonra bir olasılık bulmak için ND (0,1) uygulayabilecek bir formdadır.

C2=A2+B22ABcos(θ),θ=(A,B)σTρA,BσT2=σA2+σB22σAσBρA,B


"Hangi tip modeli kullanacağınızı doğrulamak için birini deneyin ve artıkların homoscedastik olup olmadığını kontrol edin", evet ... bu varsayımı hiç yapmamanız ve geçerli olsa bile - hiçbir şekilde "iyi" bir modeliniz var.
Repmat

Bir kişi OLS kullanıyorsa ve artıklar heterossedastik ise, o zaman kesin bir önyargıya sahip bir model vardır. Homoscedasticity, burada gösterilen bir OLS gereksinimidir . İyi bir modele sahip olmak, atlanan değişken önyargıdan kaçınmak , ancak seri ilişkisiz hatalara ve modelin bağımlı değişkene karşı doğrusallığına sahip olmak gibi diğer koşulları gerektirir .
Carl

Artıkların heterosklastik olduğu tarafsız ve / veya tutarlı bir modeliniz (tahminler) olabilir. Bu sadece olağan çıkarım prosedürlerinin işe yaramadığı anlamına gelir
Repmat

Heterossedastisite eğimi düzleştirir, bir aykırı değer düzeltmiş olsa bile, ceza büyük güven aralıkları ve berbat bir model olacaktır. Böyle bir model kullanmaz, ama evet, berbat modeller yapabiliriz. Tıbbi literatür bunlarla doludur.
Carl

Yorumunuzun ilk kısmı sadece yanlış. Bunun ne anlama geldiğinden bile emin değilim.
Repmat
Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.