İkinci formülasyonunuza şüpheli bir i eklemeniz gerekir:
çünkü ile birlikte değişebilmelidir .
yi∼N(y^i,σ2ε)
y^xi
Belirtilen, nedir? dır . Bu, @DikranMarsupial'in şu formülasyonuna yol açar:
Bunun aynı olduğunu fark etmeye değer formülasyon, çünkü hem normal dağılımları öngörür hem de beklenen değerler eşittir. Yani:
(Ve açıkça varyanslar eşittir.) Başka bir deyişle, buy^ixiβ^
yi∼N(xiβ^,σ2ε)
E[xiβ^]=E[xiβ^+E[N(0,σ2ε)]]=E[xiβ^+0]=E[xiβ^]
varsayımlarda bir fark
değil , basitçe notasyonel bir farktır.
Böylece soru, ilk formülasyonu kullanarak fikri sunmayı tercih etmek için bir neden var mı?
Cevabın iki nedenden dolayı evet olduğunu düşünüyorum :
- İnsanlar genellikle ham verilerin normal olarak dağıtılması (yani ) veya / koşullu verilerin normal olarak dağıtılması (örneğin, / ) olup olmadığını karıştırırlar. : Kalanlar normal olarak dağıtılırsa, ancak y dağıtılmazsa ne olur?X Y | X εYXY|Xε
- İnsanlar genellikle bağımsız olması gereken şeyi, ham verileri veya hataları karıştırırlar. Dahası, sık sık bir şeyin iid olması gerektiğinden (bağımsız ve aynı şekilde dağıtılmış) söz ediyoruz; açısından düşünüyorsanız, başka bir potansiyel karışıklık kaynağı olabilir, çünkü bağımsız olabilir, ancak boş hipotez geçerli olmadığı sürece aynı şekilde dağıtılamaz (ortalama değişebilir). Y | XY|XY|X
Bu karışıklıkların ikinci formülasyonu kullanma olasılığının birinciden daha fazla olduğuna inanıyorum.