이번 겨울방학 기간을 캐글과 데이콘 경진대회에 참여하여 딥러닝에 대해 학습하려고 합니다.
그렇다면 왜 딥러닝을 학습하기 위해서 경진대회에 참여하는 방법을 선택해야 할까요?
경진대회에 참여하면서 공부하는 것이 (어디에) 도움이 될까요?
의문이 들었습니다. 의문에 대한 답을 작성하려고 합니다.
제가 생각하는 경진대회에 참여하는 장점은 다음과 같습니다.
1. 학습 동기를 제공한다
경진대회에 참여한다면 점수에 따른 등수가 매겨집니다. 등수를 올리고 싶은 마음은 공부를 하려는 의지 전에 승부욕에서부터 나옵니다. 등수를 올리고 싶다는 마음이 든다면 자연스럽게 어떻게 하면 점수(메트릭)를 올릴 수 있을지 궁금해집니다. 점수를 올리기 위한 방법을 학습하는 것이 즉, 딥러닝 모델링, 효율적인 실험 방법에 대해서 학습하는 것입니다. 이들은 앞으로 본인이 딥러닝 모델을 통해 문제를 해결하기 위한 필수적인 요소입니다.
2. 문제 해결 능력 기르기
경진대회는 개최자가 제공하는 목적과 목표가 존재합니다. 예를 들어 제가 참여한 바이오헬스 데이터 경진대회의 경우는 치의학 분야에서 더 나은 진단과 치료방법을 모색하기 위한 목적으로 개최되었고 그 목표는 발치 수술 전 사랑니 x-ray 데이터를 이용하여 발치 수술 후 신경 손상의 위험을 예측하는 것입니다. 우리는 대회에 참여함으로써 대회의 목적에 맞는 목표를 이루기 위해서 다양한 실험을 진행합니다. 이 과정에서 평소에 생각하지 않던 문제의 해결 방법에 대해 논리적으로 가설을 세우고 실험을 통해 증명하는 과정을 반복합니다. 이로써 논리적인 생각을 통해 문제를 해결하는 능력을 기를 수 있습니다.
3. 다양한 데이터에 대한 적응성이 오른다
다양한 대회에 참여하며 해당 대회에서 제공하는 데이터를 보게 됩니다. 여러 종류의 데이터를 다루면서 경험치를 쌓을 수 있습니다. 이전 대회에서 다루었던 데이터와 비슷한 데이터를 보았을 때 이전 대회의 솔루션을 참고하고 데이터에 대한 개인적인 인사이트를 통해서 데이터의 특성을 쉽게 파악할 수 있는 능력을 기를 수 있습니다.
3-1. 데이터의 질이 상대적으로 좋다
크롤링을 통해 얻은 데이터나 딥러닝을 염두에 두지 않고 모아둔 데이터를 딥러닝 모델 학습에 사용하기 위해서는 전처리가 필수적입니다. 데이터 과학자는 시간의 60%를 데이터를 정리하고 구성하는 데 보냅니다. 즉, 데이터 전처리는 시간이 가장 많이 드는 작업이라고 할 수 있습니다. 대회에 참여한다면 대회 개최자에 의해서 한번 정제된 데이터를 사용할 수 있습니다. 따라서 시간 효율적으로 딥러닝 모델링에 대해서 학습할 수 있습니다.
'나의 생각' 카테고리의 다른 글
2023년을 회고하며, 2024년을 맞이하며. (1) | 2024.01.08 |
---|---|
나의 대학 생활(부스트캠프 AI tech) (3) | 2023.10.28 |