상세 컨텐츠

본문 제목

Missing Data

Data Scientist/Terms

by 디터치 2022. 8. 22. 17:53

본문

DataFrame내의 결측값들을 다루는 방법을 알아보자.
  • isna # df안의 결측값들을 True로 반환
  • isnull # isna와 동일한 문법, na(Not a number)보다 null이 결측값의 뜻을 더 직관적으로 보여주기 때문에 별칭으로 생성.
  • notna # df안의 결측값들을 False로 반환
  • notnull
  • dropna # df안의 결측값들이 1개라도 있는 행은 삭제한 후 반환 (axis=0(row), 1(column) / subset=[](특정 column 지정) / how = 'any'(하나라도 NaN), 'all'(전부 NaN))
  • fillna # df안의 결측값들을 지정한 값으로 채운 후 반환(defalut=None, ffill(앞의 값으로 채움) / bfill(뒤의 값으로 채움)) / * df.col['name'].mode()[0] (column내의 최빈값으로 채움)

'Data Scientist > Terms' 카테고리의 다른 글

list comprehension  (0) 2022.10.01
Types of Data  (0) 2022.08.22
DataFrame #1  (0) 2022.08.22

관련글 더보기

댓글 영역