https://www.facebook.com/groups/KaggleKoreaOpenGroup/permalink/828642621201172/

김선우

안녕하세요. 평소 머신러닝, 딥러닝에 관심이 많았는데 캐글은 이번에 처음 시작하게 되어 질문 드립니다. 1. 연구에서도 그렇지만 캐글에서는 특히 모델이 좋은 성능을 내도록 최적의 방법을

www.facebook.com

안녕하세요. 평소 머신러닝, 딥러닝에 관심이 많았는데 캐글은 이번에 처음 시작하게 되어 질문 드립니다.
1. 연구에서도 그렇지만 캐글에서는 특히 모델이 좋은 성능을 내도록 최적의 방법을 사용하는 것이 중요한 것 같습니다. 그러기 위해서는 최신 연구들도 참고할 필요가 있는데 최근에 논문들이 쏟아져 나오고 있는 만큼 이를 따라가기가 어렵다고 느꼈습니다. 캐글 노트북과 discussion들을 참고하는 것도 한 방법인 것 같은데 이 외에 최적의, 최신의 방법론들을 빠르게 습득하고 따라가기 위한 좋은 방법들이 있을까요?
2. 캐글 노트북은 9시간 후에 끊긴다는 단점이 있고 매번 커밋해야지만 학습 과정이 저장되는 것으로 알고 있는데 맞나요? 이러한 점 때문에 대회에서 캐글 노트북을 사용하기 어려운 경우가 있을 것 같은데 원래 다른 곳(코랩, 개인 하드웨어 등)에서 코드를 돌려보고 결과물 또는 코드를(대회에 따라) 제출하는 것이 일반적인가요?
감사합니다.

1. 커뮤니티 가입하셔서 올라오는 글들 보시거나,
탑티어학회 논문들 챙겨 보시면됩니다.

2. 네, 보통 다른 머신에서 학습하고 제출 또는
인퍼런스만 노트북에서 합니다.

안녕하세요. 캐글 입문을 축하드립니다.!
한국의 캐글 그랜드마스터 수가 ? 나라보다는 많아야 한다고 믿는 Limerobot입니다. 저는 지금까지 캐글에서 금메달 8개를 획득했었는데요, 이 경험을 바탕으로 저가 애용하는 방법을 공유 드리겠습니다.

1.
우선 캐글은 극히 실용성을 추구하기에 실제로 성능이 좋고 사용하기 쉬운 모델이나 라이브러리만 활용합니다. (왜냐면 이 외에도 할 일이 엄청 많거든요) 그래서 참여할 대회와 비슷한 종료된 대회의 상위 솔루션을 참고하시면 도움이 됩니다. 보통 좋은 것이 우승하거든요.

아래 링크는 대회 중에도 제가 계속 참고하는 곳입니다.

# 이미지 분야
최신 백본망은 아래 링크 참고
https://paperswithcode.com/sota/image-classification-on-imagenet

위의 백본망 중 아래 파이썬 패키지에서 활용 가능한 것 추천
https://github.com/qubvel/segmentation_models.pytorch

# 텍스트 분야
최신 백본망은 아래 링크를 참고
https://gluebenchmark.com/leaderboard

위의 백본망 중 아래 파이썬 패키지에서 활용 가능한 것 추천
https://github.com/huggingface/transformers

# 그 외 분야
해당 대회의 주최측에서 제공하는 정보나 대회 참여자들이 공유하는 discussion, notebooks 탭을 참고 또는 이전에 수행된 비슷한 대회를 참고하시는 게 좋습니다.










Posted by uniqueone
,