BigData/빅데이터분석실기_제2유형
fit(), transform(), fit_transform() 차이
3zzang
2022. 6. 23. 15:15
train 할것을 fit 한후 train,test에 transform하는 것이 맞다.
fit_transform은 fit+transform을 한번에 처리해주는 건데 내가 여태까지 잘못 학습하고있었다
+ 수치형 변수들 sclaer먼저 한 뒤 인코딩해주자 그다음 모델 학습!
++추가)
train 데이터에는 없었는데 test 데이터에 처음보는 라벨명이 있으면 에러가 난다.
참고한 코드 및 링크 : https://stackoverflow.com/questions/66365190/y-contains-previously-unseen-labels-male-in-label-encoder
y contains previously unseen labels: 'Male' in Label encoder
I am trying to convert the categorical column of my dataset into numerical using LabelEncoder. dataset Here is the conversion code: for i in cat_columns: df[i]=encoder.fit_transform(df[i]) After
stackoverflow.com
from sklearn import preprocessing
encoders = {}
for i in cat_columns:
encoders[i] = preprocessing.LabelEncoder()
df[i] = encoders[i].fit_transform(df[i])
for i in cat_columns:
df1[i] = encoders[i].transform(df1[i])