안녕하세요.
이번에 Tracking 관련해서 연구를 시작하게 되었는데, 라벨링 관련해서 궁금한게 있어 질문올립니다.
현재 비디오에서 annotation을 하는 중인데, 30만장이 넘는 데이터셋이라서 수작업은 불가능하다고 판단하고 다음과 같은 과정으로 annotation을 진행했습니다.
비디오에서 Object가 Translation과 Rotation만 일어나는 것을 확인
Unet으로 비디오 첫 프레임의 Object만 학습시킨뒤 나머지는 Prediction
전처리후 육안으로 걸러내면 annotation 완료

음.. 그런데, 수작업이 아니다보니 annotation된 데이터는 어느정도의 오차를(육안으로 5%정도) 가질수 밖에 없는데, 해당 오차를 가지고 있는 데이터셋으로 실험을 했을 때 이게 합당하느냐에 대한 질문을 받았습니다.

혹시 비디오 이미지에서 라벨링을 하시는 분들은 어떻게 하고 계신지, 그리고 이런 문제에 대해서 다루고 있는 논문같은게 있으면 공유를 부탁드립니다 ㅜㅜ
미리 감사드립니다 :)

돈이 있으시면 https://aws.amazon.com/ko/sagemaker/groundtruth/

Posted by uniqueone
,