Kullanırken hakkında okurken StandardScaler
, önerilerin çoğu tren / teste veri bölmeden StandardScaler
önce kullanmanız gerektiğini söylüyorlardı , ancak çevrimiçi (sklearn kullanarak) yayınlanan bazı kodları kontrol ederken iki büyük kullanım vardı.
1- StandardScaler
Tüm verilerin kullanılması. Örneğin
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_fit = sc.fit(X)
X_std = X_fit.transform(X)
Veya
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X = sc.fit(X)
X = sc.transform(X)
Ya da sadece
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_std = sc.fit_transform(X)
2- StandardScaler
Ayrık verilerde kullanma .
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform (X_test)
Verilerimi standartlaştırmak istiyorum, ancak hangi yöntemin en iyisi olduğu konusunda kafam karıştı!