Aşağıdaki gibi giden ülkeleri içeren bir veri çerçevem olduğunu varsayalım:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Ülkeleri 'tek sıcak kodlamalara' dönüştürmek için bir pd.get_dummies işlevi olduğunu biliyorum. Ancak, bunun yerine alacağım şekilde onları endekslere dönüştürmek istiyorum cc_index = [1,2,1,3]
.
Aşağıda gösterildiği gibi bir numpy where cümlesiyle birlikte get_dummies kullanmaktan daha hızlı bir yol olduğunu varsayıyorum:
[np.where(x) for x in df.cc.get_dummies().values]
Bunu R'de 'faktörleri' kullanarak yapmak biraz daha kolaydır, bu yüzden pandalarda da benzer bir şey olduğunu umuyorum.
cc_index = [0,1,0,2]
?