안녕하세요! 얼마 전에 voice separation 을 공유 드렸었는데, Singing Voice Separation 학습을 추가하여 재공유 드립니다.

주요 특징으로 먼저, 데이터셋은 DSD100을 활용하였으며 Voice Bank, Audioset 등과 joint training 을 하였습니다. 특히 기존 Source Separation과 다르게 듣는 귀를 만족시켜보고자 44.1k sample rate을 이용하였습니다.
github link : https://github.com/AppleHolic/source_separation

이전과 마찬가지로 샘플을 만들어 보았는데요, 유튜브 재생목록에 총 5가지 제(+@)가 좋아하는 가요로 테스트 샘플을 공유해두었습니다.
Youtube Playlist : https://www.youtube.com/playlist?list=PLQ4ukFz6Ieir5bZYOns08_2gMjt4hYP4I

5개 중 성시경-거리에서는 배경음은 그대로인 채로 목소리만 shifting하여 더해 보았습니다. 기존에 듣던 곡에서 조금 신선한 느낌을 느끼실 수 있을 거라 생각되며, 이런 식으로 활용할 수 있다는 사실이 재밌었습니다.
https://www.youtube.com/watch?v=xmoBUf_6b0c&list=PLQ4ukFz6Ieir5bZYOns08_2gMjt4hYP4I&index=1

체크포인트 파일은 조만간 업로드 예정입니다. 문제점 혹은 개선 사항 있으시면 편하게 연락 주세요~ 감사합니다.
https://www.facebook.com/groups/PyTorchKR/permalink/1511168179022858/?sfnsn=mo
Posted by uniqueone
,