상세 컨텐츠

본문 제목

2022 관광데이터 AI 경진대회 - Dacon #2

Data Scientist/Projects

by 디터치 2022. 9. 22. 19:48

본문

대회 상세페이지

 

2022 관광데이터 AI 경진대회 - DACON

분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.

dacon.io

9/22

 

텍스트

- 소분류를 대/중분류에서 분류하기

- 내용에서 반복되는 단어들 추출하기

- 핵심단어 추출

 

* 소개내용이 일관되게 흘러가진 않지만 '-이다.'의 통일성과 특징적인 대명사들이 자주 등장하여 다행이라고 생각한다.

전달하고자 하는 목표 역시 명확하고 오타가 없는 듯 하여 잘 쓰기만 하면 될 것 같다.

다만, 같은 장소에서 이루어지는 체험의 경우에는 중복되는 대명사가 있어 단어가 문장내에 위치하는 곳에따라 가산점을 주는 방식과 두번째, 세번째 문장내에서 어느 단어가 반복되고 강조되는지를 잘 고려해봐야겠다.

 

 

**tidy data형태로 변환한 후에, 소분류에 따른 내용들을 파악해야겠다.

 

관련글 더보기

댓글 영역