Birkaç ay önce bu organizasyonda staj yaptım; ve uzak bir hediye olarak, öğretmenimin maaşlarını etkileyen faktörleri araştırmak için geçen haftamı ne zamanım olursa olsun harcamaya karar verdim. Öğretmen maaşlarında karşılaştığım sorunlardan biri, verilen devletin dağılımının çarpık olmasıydı. Ücret spektrumunun alt ucuna yapışan birçok gözlemim vardı. Bağımlı değişkenime (öğretmen ücretleri) Karşılaştırılabilir bir Ücret Endeksi ekleyerek bunu çözmeyi denedim, ancak bulduğum sonuçlar projemin kapsamı için tamamen güncel değildi. Bunun yerine bağımlı değişkenimi kaydetmeye karar verdim. Bu güzeldi çünkü ücretlerimin dağılımı normaldi ve histogramda mükemmel görünüyordu. Teste başladığımda son bir bağımsız değişken olan emlak vergisi getirisi ile kaldığım noktaya geldim. Normatif ücretlerimdeki sorun, emlak vergisi beyannamesi gözlemlerinde de açıkça görülüyordu. Spektrumun alt ucuna doğru büyük bir emlak vergisi beyannamesi sayım vardı. Bu değişkeni de kaydettim ve yine de sıfır hipotez testini geçti.
Bunun tam olarak doğru olup olmadığından emin değilim, ancak bir günlüğe kaydedilen değişkenin başka bir günlüğe kaydedilen değişkenle karşılaştırılması bana esneklik verdi. Bunun doğru olduğunu varsayarsak, regresyon denklemim (LogWages = B0 + B1 (LogPropertyTaxReturns) gibi bir şey) iki değişken arasındaki esnekliği gösterir. Bu anlamlı mı? Amacım, eyaletimin herhangi bir ilçesinde hangi değişkenin en çok öğretmen maaşını etkilediğini görmekse, iki değişken arasındaki esnekliği göstermek yardımcı olur mu? En düşük öğretmen maaşlarıyla ilçeleri yaşam standartlarını yükseltmek için yükseltmek istiyoruz, ancak sonuçtaki regresyon denklemimin anlamsız olduğu gerçek gözlemlerden çok uzakta tahmin ettiğimden korkuyorum.
Edit: Benim daha büyük korkularım ben ilişkiyi göstermek için doğrusal olmayan bir model kullanmış olması gerektiğidir. Hem bağımlı hem de bağımsız değişkeni bu lineer regresyonda işbirliği yapmaya zorlamanın bir şekilde yanıltıcı olduğunu hissediyorum.