TensorFlow Korea 논문읽기모임 PR12 197번째 논문 review입니다

Deep Learning/Papers2read 2019. 10. 1. 10:38

https://www.facebook.com/groups/TensorFlowKR/permalink/997406130600445/

(2기 목표 200편까지 이제 3편이 남았습니다!!)

이번에 제가 발표한 논문은 FAIR(Facebook AI Research)에서 나온 One ticket to win them all: generalizing lottery ticket initializations across datasets and optimizers 입니다

한 장의 ticket으로 모든 복권에서 1등을 할 수 있다면 얼마나 좋을까요?

일반적인 network pruning 방법은 pruning 하기 이전에 학습된 network weight를 그대로 사용하면서 fine tuning하는 방법을 사용해왔습니다

pruning한 이후에 network에 weight를 random intialization한 후 학습하면 성능이 잘 나오지 않는 문제가 있었는데요

작년 MIT에서 나온 Lottery ticket hypothesis라는 논문에서는 이렇게 pruning된 이후의 network를 어떻게 random intialization하면 높은 성능을 낼 수 있는지

이 intialization 방법을 공개하며 lottery ticket의 winning ticket이라고 이름붙였습니다.

그런데 이 winning ticket이 혹시 다른 dataset이나 다른 optimizer를 사용하는 경우에도 잘 동작할 수 있을까요?

예를 들어 CIFAR10에서 찾은 winning ticket이 ImageNet에서도 winning ticket의 성능을 나타낼 수 있을까요?

이 논문은 이러한 질문에 대한 답을 실험을 통해서 확인하였고, initialization에 대한 여러가지 insight를 담고 있습니다.

자세한 내용은 발표 영상을 참고해주세요~!

영상링크: https://youtu.be/YmTNpF2OOjA

발표자료링크: https://www.slideshare.net/…/pr197-one-ticket-to-win-them-a…

논문링크: https://arxiv.org/abs/1906.02773

저작자표시 비영리 동일조건 (새창열림)

'Deep Learning > Papers2read' 카테고리의 다른 글

안녕하세요, 수아랩의 이호성입니다.얼마전에 ICCV 2019 학회에 대한 간단한 시각화 자료를 공유드렸었는데요, 이번에는 제 관심사를 바탕으로 1077편의 논문 중에 22편을 정해서 각 논문당 2~3줄.. (0)	2019.10.01
이번 스터디에서는 BNN 학습을 Cost Function을 정의하고 최적화하여 접근하는 방식을 소개한 XNOR-Net과 1x1 Conv와 3x3 Conv의 조합을 통해 Network를 Reduction하는 SqueezeNet을 다루었습니다! 두 발표자분 모.. (0)	2019.10.01
Gaze Estimation for Assisted Living Environments https://www.profillic.com/paper/arxiv:1909.09225 Experiments on images from a real assisted living environment demonstrate the higher suitability of their model for its final application. (0)	2019.09.30
안녕하세요? 텐플코 여러분. 어제 자정 마감이었던 ICLR 2020의 논문 제출수가 대략 2600건이 된 것 같습니다. 학회장이 에디오피아라 내심 제출건수가 좀 줄기를 기대했건만 1000건이나 더 늘었다.. (0)	2019.09.26
Great applications for the healthcare industry: 3D Mesh Reconstruction from Single 2D Image for Right Ventricle https://www.profillic.com/paper/arxiv:1909.08986 "Instantiation-Net: 3D Mesh Reconstruction from Single 2D Image for Right Ventricle" (0)	2019.09.25

Posted by uniqueone

Be the only one, not the best one

TensorFlow Korea 논문읽기모임 PR12 197번째 논문 review입니다

'Deep Learning > Papers2read' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바