2022 관광데이터 AI 경진대회 - DACON
분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.
dacon.io
10/1
각 cat별로 특징적인 단어들 추출하여 dataframe 만들기
- 각 overview별로 해당되는 단어 또는 등장횟수를 구하여 dict형태로 저장
- 모아놓은 dict를 합쳐 dataframe 만들기
- class로 Tokenize, 함수화로 각 카테고리별 진행
- 종합 퍼센티지 or (실측값 vs 예측값)을 (0,1)로 기록
* 클래스, 함수화 하는 도중에 '은', '는', '-다', '또', '에서' 등 조사 및 전치사 등을 제거하고 일반 명사, 대명사만 추출하기
** 그래프는 단어별 분포도, 분산그래프와 상관계수 컬러맵을 사용하여 시각화할 예정이다.
*** 아직 손코딩으로만 진행 중이고 코랩으로 조금씩 돌려보는 중이라 시행착오를 조금 많이 겪고있다.
2022 관광데이터 AI 경진대회 - Dacon #4 (0) | 2022.09.28 |
---|---|
2022 관광데이터 AI 경진대회 - Dacon #3 (0) | 2022.09.26 |
2022 관광데이터 AI 경진대회 - Dacon #2 (0) | 2022.09.22 |
2022 관광데이터 AI 경진대회 - Dacon #1 (0) | 2022.09.21 |
댓글 영역