LabelEncoder の挙動とハマったポイントをメモしておきます
sklearn の version は 0.22.2.post1 です
Label Encoder の挙動
まずは lib を import してデータを準備します
import pandas as pd
from sklearn import preprocessing
# data を準備する
df = pd.DataFrame({
'data': ["ABC", "DEF", "GHI"]
})fit させます
le = preprocessing.LabelEncoder()
le.fit(df['data'])transform をすると encode 結果が取り出せます
le.transform(df['data'])
>> array([0, 1, 2])list を入力しても動きます
le.transform(['DEF'])
>> array([1])存在しない値を入れると exception が発生します