Data Scientist/Terms

Missing Data

디터치 2022. 8. 22. 17:53
DataFrame내의 결측값들을 다루는 방법을 알아보자.
  • isna # df안의 결측값들을 True로 반환
  • isnull # isna와 동일한 문법, na(Not a number)보다 null이 결측값의 뜻을 더 직관적으로 보여주기 때문에 별칭으로 생성.
  • notna # df안의 결측값들을 False로 반환
  • notnull
  • dropna # df안의 결측값들이 1개라도 있는 행은 삭제한 후 반환 (axis=0(row), 1(column) / subset=[](특정 column 지정) / how = 'any'(하나라도 NaN), 'all'(전부 NaN))
  • fillna # df안의 결측값들을 지정한 값으로 채운 후 반환(defalut=None, ffill(앞의 값으로 채움) / bfill(뒤의 값으로 채움)) / * df.col['name'].mode()[0] (column내의 최빈값으로 채움)