여러분, 안녕하세요. 간만에 인사드립니다. 아실 만한 분들은 아시겠지만 ratsgo라는 필명으로 블로그를 운영하고 있는 이기창이라고 합니다. s
Deep Learning/resources 2020. 6. 22. 10:02여러분, 안녕하세요. 간만에 인사드립니다. 아실 만한 분들은 아시겠지만 ratsgo라는 필명으로 블로그를 운영하고 있는 이기창이라고 합니다. speechbook이라는 페이지를 여러분들께 소개해 드리려고 이 야심한 시각에 키보드를 두드립니다.
지난 6개월동안 회사에서 Spoken Language Understanding이라는 태스크를 수행하고 있었습니다. 음성 입력이 주어졌을 때 해당 음성의 의도(intent)를 분류(classification)하는 모델을 구축하는 작업입니다.
음성에는 문외한이라 공부하면서 모델 만들고 모델 만들다 막히면 다시 공부하고 그런 과정을 겪었습니다. 맨땅에 헤딩하듯이 시행착오를 겪다보니 어느덧 6개월이라는 시간이 지나있더군요.
공부하면서 느낀 것인데요. 음성 인식 내지 음성 신호 처리와 관련한 한국어 자료가 정말 없더라고요. 주변 분들을 많이 괴롭히는 방식으로 지적 목마름을 채웠습니다(다시 한번 여러분들께, 특히 모두의연구소 음성 풀잎스쿨 분들께 감사를!).
그래서 다짐했습니다. 많이 부족하지만 음성 인식 관련한 한국어 자료를 만들어보자고요. 이 결심에는 오픈소스 생태계의 힘을 빌려보자는 알량한 생각도 좀 있었습니다. 제가 먼저 스타트를 끊으면 무림고수 분들이 누더기 같은 자료의 질을 높여줄 것이라는 기대 말이죠.
컨텐츠를 만들고 공유하는 방식에 대한 고민도 좀 있었습니다. 기존 ratsgo 블로그는 아티클 단위의 소비가 이뤄지고 있습니다. 특정 키워드 검색으로 인입된 트래픽이 해당 아티클만 보고 떠나는 경향이 있습니다.
ratsgo 블로그 독자 가운데는 "블로그 공부 순서를 알려주셨으면 좋겠다"고 하시는 분들도 있습니다. 하지만 기존 블로그는 처음부터 아티클 단위로 기획된 블로그이기 때문에 순서를 정해 알려드리기가 쉽지 않더라고요. 음악 앨범이나 신문 지면이 그렇게 하고 있는 것처럼 아티클 배치 순서나 아티클과 아티클 사이 공백을 채워야겠다는 생각이 들었습니다.
썰이 길었는데요. speechbook은 이러한 배경에서 탄생한 페이지입니다. '음성 인식 관련 한국어 자료' 컨셉으로 만들었고요. Hidden Markov Model 같은 기존 음성 인식 시스템 관련한 내용은 스탠포드 대학의 'Speech and Language Processing'을 중심으로 정리했습니다. 딥러닝 계열 모델들은 최신 논문을 많이 포함했습니다. 목차대로 읽으면 이해가 될 수 있도록 목차와 아티클 배치에 신경을 썼습니다.
많이 부족하지만 speechbook을 여러분들께 소개드리는 이유는 한국어 ML 컨텐츠가 좀 더 많이 유통되었으면 바람에서입니다. 질문이나 의견, 오류 신고 등을 격하게 환영합니다. 기존 블로그와 달리 본문/목차의 수정/보완/삭제/추가 관련 Pull Request를 적극적으로 받고자 합니다. 모든 페이지에 의견을 남길 수 있으며 모두 github issue와 연동됩니다.
무림고수 분들께서 도와주시면 좀 더 양질의 지식을 많은 분들께 공유할 수 있지 않을까 싶습니다. 그만큼 우리 지식의 수준이 높아질 것이라 기대합니다. 그럼 앞으로 잘 부탁드리겠습니다.