안녕하세요 rl kr. 개인적으로 오랜 숙제였던 IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures(IMPALA)를 구현하여 결과를 공유합니다. tensorflow로 구현하였습니다(pytorch로 하지..

Deep Learning/resources 2019. 10. 28. 00:18

안녕하세요 rl kr. 개인적으로 오랜 숙제였던 IMPALA: Scalable Distributed Deep-RL with Importance Weighted Actor-Learner Architectures(IMPALA)를 구현하여 결과를 공유합니다. tensorflow로 구현하였습니다(pytorch로 하지 못해 토치 유저분들에게는 죄송하다는 말씀을 올리며). 사용한 것은 distributed tensorflow를 기본적으로 사용하였습니다. 제 예전 actor critic으로 breakout을 잘 배우기 위해서는 엄청나게 오랜시간(10시간정도)걸렸지만 20개의 actor로 2시간만에 의미있는 결과를 뽑아낼 수 있었습니다. 혹시 코드에서 오류 혹은 수식을 코드로 옮기는 과정에서 잘못된 부분이 있다면 바로 알려주시면 감사하겠습니다.

ps. 윤수로님께 감사하다는 말씀 올립니다.
https://www.facebook.com/groups/ReinforcementLearningKR/permalink/2324753411097219/?sfnsn=mo

'Deep Learning > resources' 카테고리의 다른 글

#정보공유 #행사 안녕하세요! RLKorea 운영진입니다! 지난 10월 27~28일 RLKorea Bootcamp가 진행되었는데요! 강화학습의 기초개념인 MDP부터 시작하여 DQN, A2C, DDPG, SAC 등 다양한 강화학습 알고리즘.. (0)	2019.10.29
[XGBoost/LightGBM] Laurae++: xgboost / LightGBM 이번에는 Kaggle에서 가장 많이 사용되는 모델인 xgboost와 lgbm에 관련된 내용입니다. @laurae 님이 만든 xgboost/lightgbm 웹페이지입니다. 공식 documentation에서도 .. (0)	2019.10.28
Atrio: AI assisted ECG web application #alertedh (0)	2019.10.25
안녕하세요! 얼마 전에 voice separation 을 공유 드렸었는데, Singing Voice Separation 학습을 추가하여 재공유 드립니다. 주요 특징으로 먼저, 데이터셋은 DSD100을 활용하였으며 Voice Bank, Audioset 등과 joi.. (0)	2019.10.25
안녕하세요! 파이썬으로 할 수 있는 time series 분석에 대해 정말 많은 것을 담고 있는 좋은 포스트입니다. https://www.machinelearningplus.com/time-series/time-series-analysis-python/ 최근 열린 ASHRAE 대회도, t.. (0)	2019.10.22