Feragatname: Bu bir ev ödevi projesi içindir.
Birkaç değişkene bağlı olarak elmas fiyatları için en iyi modeli bulmaya çalışıyorum ve şimdiye kadar oldukça iyi bir modelim var gibi görünüyor. Ancak ben açıkça collinear olan iki değişkenle karşılaştık:
>with(diamonds, cor(data.frame(Table, Depth, Carat.Weight)))
Table Depth Carat.Weight
Table 1.00000000 -0.41035485 0.05237998
Depth -0.41035485 1.00000000 0.01779489
Carat.Weight 0.05237998 0.01779489 1.00000000
Tablo ve Derinlik birbirine bağımlıdır, ancak yine de bunları tahmin modelime dahil etmek istiyorum. Elmaslar üzerinde biraz araştırma yaptım ve Tablo ve Derinlik'in bir elmasın üstündeki uzunluk ve bir elmasın yukarıdan aşağı ucuna olan mesafe olduğunu buldum. Elmasların bu fiyatları güzellik ve güzellik ile ilişkili gibi göründüğü için oranlarını da ekleyecektim, örneğin , fiyatları tahmin etmek. Bu, doğrusal değişkenlerle başa çıkmak için standart bir prosedür mü? Değilse, nedir?
Düzenleme: İşte Derinlik bir çizim ~ Tablo: