yuns

카테고리 데이터 처리하기 본문

카테고리 없음

카테고리 데이터 처리하기

yuuuun 2022. 4. 12. 23:04
반응형

​pandas.get_dummies()

데이터를 분석할 때, 카테고리 데이터는 원-핫 인코딩으로 바꿔줘야 된다.

이때, 아래 간단한 함수를 이용해 바꿀 수 있다.

pd.get_dummies(train)

특정 열만 하고 싶으면 아래와 같이 한다.

pd.get_dummies(train, columns=['col명'])

drop_first=True는,, 열을 n-1개 만든다는데 뭔지 모르겠다.

결측값 처리를 위해서는 dummy_na=True 

참고,, 

pd.get_dummies(train, columns=['col명'], prefix='col명')
반응형
Comments