D'Touch

고정 헤더 영역

글 제목

메뉴 레이어

D'Touch

메뉴 리스트

  • 홈
  • 분류 전체보기 (11)
    • SQL (0)
      • SQLD (0)
    • Data Scientist (11)
      • Subjects (1)
      • Terms (4)
      • Projects (5)
      • Errors (0)
    • Health (0)
    • Review (0)

검색 레이어

D'Touch

검색 영역

컨텐츠 검색

Data Scientist

  • Missing Data

    2022.08.22 by 디터치

  • EDA (Exploratory Data Analysis)

    2022.08.22 by 디터치

  • 코드스테이츠 AIB 후기

    2022.08.16 by 디터치

Missing Data

DataFrame내의 결측값들을 다루는 방법을 알아보자. isna # df안의 결측값들을 True로 반환 isnull # isna와 동일한 문법, na(Not a number)보다 null이 결측값의 뜻을 더 직관적으로 보여주기 때문에 별칭으로 생성. notna # df안의 결측값들을 False로 반환 notnull dropna # df안의 결측값들이 1개라도 있는 행은 삭제한 후 반환 (axis=0(row), 1(column) / subset=[](특정 column 지정) / how = 'any'(하나라도 NaN), 'all'(전부 NaN)) fillna # df안의 결측값들을 지정한 값으로 채운 후 반환(defalut=None, ffill(앞의 값으로 채움) / bfill(뒤의 값으로 채움)) / *..

Data Scientist/Terms 2022. 8. 22. 17:53

EDA (Exploratory Data Analysis)

데이터 분석에 있어 raw data (원본데이터)를 바로사용하기에는 어렵습니다. EDA란, 데이터 분석에 있어서 매우 중요한, 초기 분석의 단계를 의미하며 시각화 같은 도구를 통해서 패턴을 발견하거나 데이터의 특이성을 확인하거나 통계와 그래픽 (혹은 시각적 표현)을 통해서 가설을 검정하는 과정 등을 포함합니다. EDA의 방법은 크게 2가지 (Graphic, Non-Graphic) 으로 나눠질 수 있으며 Graphic : 차트 혹은 그림 등을 이용하여 데이터를 확인하는 방법입니다. Non-Graphic :그래픽적인 요소를 사용하지 않는 방법으로, 주로 Summary Statistics를 통해 데이터를 확인하는 방법입니다. 동시에, EDA의 "타겟"(데이터) 또한 2가지 (Univariate, Multi-v..

Data Scientist/Subjects 2022. 8. 22. 17:44

코드스테이츠 AIB 후기

본문에 앞서 필자는 파이썬 3개월, 쟝고 웹사이트 기초 제작 등을 서적과 유튜브로 공부한 뒤 부트캠프 형식에 대한 지식이 전무한 상태에서 교육을 시작했다. - 타 교육생들에 비해 많이 부족하였고 정말 처음 들어보는 용어와 개념이었다. 우선, 해당 부트캠프를 이용하는게 좋을 것 같은 사람들은 대학 3학년, 취업직전 개념 복습 또는 나와 같이 AI 관련 지식이 전무한 사람도 괜찮다 생각한다. 매일 새로운 개념을 이해하고 과제를 수행해가며 매주 간단한 테스트를 통해 실력을 발전시키고 매달 한 개의 프로젝트를 결과물로 복습 및 피드백까지 가능하다. 이렇게 보면 매우 쉽게 이행할 수 있는 커리큘럼으로 보이지만, 꾸준히 공부해왔던 게 아닌 사람에게는 지옥과 같은 스케줄이었다. * Curriculum - Daily:..

Data Scientist 2022. 8. 16. 18:09

추가 정보

인기글

최신글

페이징

이전
1 2
다음
TISTORY
D'Touch © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바