안녕하세요!

최근 모두의 말뭉치가 새로 공개된 겸하여 KoELECTRA-v3를 새로 만들었습니다:)
모두의 말뭉치를 포함한 약 34GB 데이터로 Pretraining
Mecab과 Wordpiece를 이용하여 Vocab 새로 제작

다행히도 여러 Task에서 눈에 띄는 성능 향상이 보이네요 (역시 데이터가 많은 게 최고네요ㅎ)
많은 분들이 사용해주셔서 항상 감사하고, 새로 공개한 모델도 한국어 NLP 연구에 많은 도움이 되었으면 좋겠습니다! 🤗
- Github: https://github.com/monologg/KoELECTRA

Posted by uniqueone
,