2022 관광데이터 AI 경진대회 - DACON
분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.
dacon.io
9/22
텍스트
- 소분류를 대/중분류에서 분류하기
- 내용에서 반복되는 단어들 추출하기
- 핵심단어 추출
* 소개내용이 일관되게 흘러가진 않지만 '-이다.'의 통일성과 특징적인 대명사들이 자주 등장하여 다행이라고 생각한다.
전달하고자 하는 목표 역시 명확하고 오타가 없는 듯 하여 잘 쓰기만 하면 될 것 같다.
다만, 같은 장소에서 이루어지는 체험의 경우에는 중복되는 대명사가 있어 단어가 문장내에 위치하는 곳에따라 가산점을 주는 방식과 두번째, 세번째 문장내에서 어느 단어가 반복되고 강조되는지를 잘 고려해봐야겠다.
**tidy data형태로 변환한 후에, 소분류에 따른 내용들을 파악해야겠다.
2022 관광데이터 AI 경진대회 - Dacon #5 (0) | 2022.10.01 |
---|---|
2022 관광데이터 AI 경진대회 - Dacon #4 (0) | 2022.09.28 |
2022 관광데이터 AI 경진대회 - Dacon #3 (0) | 2022.09.26 |
2022 관광데이터 AI 경진대회 - Dacon #1 (0) | 2022.09.21 |
댓글 영역