카테고리 없음
카테고리 데이터 처리하기
yuuuun
2022. 4. 12. 23:04
반응형
pandas.get_dummies()
데이터를 분석할 때, 카테고리 데이터는 원-핫 인코딩으로 바꿔줘야 된다.
이때, 아래 간단한 함수를 이용해 바꿀 수 있다.
pd.get_dummies(train)
특정 열만 하고 싶으면 아래와 같이 한다.
pd.get_dummies(train, columns=['col명'])
drop_first=True는,, 열을 n-1개 만든다는데 뭔지 모르겠다.
결측값 처리를 위해서는 dummy_na=True
참고,,
pd.get_dummies(train, columns=['col명'], prefix='col명')
반응형