BigData/빅데이터분석실기_제2유형

fit(), transform(), fit_transform() 차이

3zzang 2022. 6. 23. 15:15

train 할것을 fit 한후 train,test에 transform하는 것이 맞다.

fit_transform은 fit+transform을 한번에 처리해주는 건데 내가 여태까지 잘못 학습하고있었다

 

+ 수치형 변수들 sclaer먼저 한 뒤 인코딩해주자 그다음 모델 학습!

++추가)

train 데이터에는 없었는데 test 데이터에 처음보는 라벨명이 있으면 에러가 난다.

 

참고한 코드 및 링크 : https://stackoverflow.com/questions/66365190/y-contains-previously-unseen-labels-male-in-label-encoder

 

y contains previously unseen labels: 'Male' in Label encoder

I am trying to convert the categorical column of my dataset into numerical using LabelEncoder. dataset Here is the conversion code: for i in cat_columns: df[i]=encoder.fit_transform(df[i]) After

stackoverflow.com

 

from sklearn import preprocessing

encoders = {}
for i in cat_columns:
    encoders[i] = preprocessing.LabelEncoder()
    df[i] = encoders[i].fit_transform(df[i])
    
for i in cat_columns:
    df1[i] = encoders[i].transform(df1[i])