Veri setimde numaralandırmak istediğim iki kategorik sütun var. İki sütunun her ikisi de ülkeler içerir, bazıları çakışır (her iki sütunda da görünür). Aynı ülke için aynı numarayı sütun1 ve sütun2'de vermek istiyorum.
Verilerim şöyle görünüyor:
import pandas as pd
d = {'col1': ['NL', 'BE', 'FR', 'BE'], 'col2': ['BE', 'NL', 'ES', 'ES']}
df = pd.DataFrame(data=d)
df
Şu anda veri gibi dönüştürüyorum:
from sklearn.preprocessing import LabelEncoder
df.apply(LabelEncoder().fit_transform)
Ancak bu FR ve ES arasında bir ayrım yapmaz. Aşağıdaki çıktıya gelmenin başka bir basit yolu var mı?
o = {'col1': [2,0,1,0], 'col2': [0,2,4,4]}
output = pd.DataFrame(data=o)
output